orcarouter/auto é um roteador nomeado
que criamos para toda conta no cadastro. Ele encaminha cada
requisição para o modelo de chat ativo mais barato ao qual sua conta
tem acesso, escolhido fresco por requisição.
Uso
Comportamento padrão
A configuração semeada:- Padrão: vazio — combina com todo modelo de chat ao qual sua conta tem acesso. Novos modelos que entram em operação se tornam candidatos automaticamente.
- Estratégia:
cheapest— escolhe o modelo com o menor preço por token entre candidatos ativos. - Modelo padrão: nenhum. Se o padrão resolver para nenhum modelo disponível, a requisição falha com um erro claro. Você pode definir um padrão no painel se quiser uma rede de segurança.
openai/*),
trocar a estratégia, definir um default_model ou deletar o roteador
inteiramente — igual a qualquer
roteador nomeado.
Trocando estratégias
O painel expõe quatro cartões de estratégia. Cheapest é o padrão semeado acima; escolha outro para mudar comoorcarouter/auto
resolve as escolhas:
| Cartão | Enum de backend | O que faz |
|---|---|---|
| Cheapest | cheapest | Menor preço por token entre candidatos ativos. O padrão semeado. |
| Quality | quality | Maior pontuação de qualidade entre candidatos ativos, independentemente do preço. |
| Balanced | balanced | Escolhe uma opção de baixo custo que ainda atende a uma barra de qualidade; cai para a opção de maior qualidade se nada atender à barra. Padrão para novos roteadores que você cria. |
| Adaptive | linucb / gated_adaptive | Bandit contextual LinUCB por roteador que aprende com seu tráfego real para ponderar qualidade, custo, latência e confiabilidade por requisição. Dois sub-modos (Standard / Gated) — veja Roteadores nomeados. |
Quando preferir o Roteador automático em vez de nomes de modelo explícitos
- Você não quer fixar em um modelo específico; quer o modelo de chat ativo mais barato a cada requisição.
- Você está prototipando e não quer se preocupar com qual provedor está ativo.
- Você quer que o roteamento do OrcaRouter “simplesmente funcione” sem pensar nisso.
Quando preferir nomes de modelo explícitos
- Você precisa de saída determinística — escolher modelos diferentes em momentos diferentes mudará o estilo e a qualidade da geração.
- Você está usando recursos específicos de um modelo (ex.:
cache_controldo Claude ou a geração nativa de imagem de um modelo). - Você quer custo previsível por requisição.
Vendo o que o Roteador automático escolheu
Verifique o cabeçalho de respostaX-Orca-Resolved-Model. Veja
Cabeçalhos de resposta.
