Saltar para o conteúdo principal
orcarouter/auto é um roteador nomeado que criamos para toda conta no cadastro. Ele encaminha cada requisição para o modelo de chat ativo mais barato ao qual sua conta tem acesso, escolhido fresco por requisição.

Uso

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)
Nenhuma outra configuração necessária — o roteador existe no momento em que sua conta é criada.

Comportamento padrão

A configuração semeada:
  • Padrão: vazio — combina com todo modelo de chat ao qual sua conta tem acesso. Novos modelos que entram em operação se tornam candidatos automaticamente.
  • Estratégia: cheapest — escolhe o modelo com o menor preço por token entre candidatos ativos.
  • Modelo padrão: nenhum. Se o padrão resolver para nenhum modelo disponível, a requisição falha com um erro claro. Você pode definir um padrão no painel se quiser uma rede de segurança.
Você pode ver e editar seu Roteador automático no painel em Routing. Pode estreitar o padrão (ex.: restringir a openai/*), trocar a estratégia, definir um default_model ou deletar o roteador inteiramente — igual a qualquer roteador nomeado.

Trocando estratégias

O painel expõe quatro cartões de estratégia. Cheapest é o padrão semeado acima; escolha outro para mudar como orcarouter/auto resolve as escolhas:
CartãoEnum de backendO que faz
CheapestcheapestMenor preço por token entre candidatos ativos. O padrão semeado.
QualityqualityMaior pontuação de qualidade entre candidatos ativos, independentemente do preço.
BalancedbalancedEscolhe uma opção de baixo custo que ainda atende a uma barra de qualidade; cai para a opção de maior qualidade se nada atender à barra. Padrão para novos roteadores que você cria.
Adaptivelinucb / gated_adaptiveBandit contextual LinUCB por roteador que aprende com seu tráfego real para ponderar qualidade, custo, latência e confiabilidade por requisição. Dois sub-modos (Standard / Gated) — veja Roteadores nomeados.
O Adaptive precisa de um breve warm-up por modelo antes de começar a guiar as escolhas. Durante o warm-up ele se comporta como Balanced — isso é esperado, não um bug.

Quando preferir o Roteador automático em vez de nomes de modelo explícitos

  • Você não quer fixar em um modelo específico; quer o modelo de chat ativo mais barato a cada requisição.
  • Você está prototipando e não quer se preocupar com qual provedor está ativo.
  • Você quer que o roteamento do OrcaRouter “simplesmente funcione” sem pensar nisso.

Quando preferir nomes de modelo explícitos

  • Você precisa de saída determinística — escolher modelos diferentes em momentos diferentes mudará o estilo e a qualidade da geração.
  • Você está usando recursos específicos de um modelo (ex.: cache_control do Claude ou a geração nativa de imagem de um modelo).
  • Você quer custo previsível por requisição.

Vendo o que o Roteador automático escolheu

Verifique o cabeçalho de resposta X-Orca-Resolved-Model. Veja Cabeçalhos de resposta.
res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# ex.: "openai/gpt-4o-mini"