Roteador automático

orcarouter/auto é um roteador nomeado que criamos para toda conta no cadastro. Ele encaminha cada requisição para o modelo de chat ativo mais barato ao qual sua conta tem acesso, escolhido fresco por requisição.

Uso

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)

Nenhuma outra configuração necessária — o roteador existe no momento em que sua conta é criada.

Comportamento padrão

A configuração semeada:

Padrão: vazio — combina com todo modelo de chat ao qual sua conta tem acesso. Novos modelos que entram em operação se tornam candidatos automaticamente.
Estratégia: cheapest — escolhe o modelo com o menor preço por token entre candidatos ativos.
Modelo padrão: nenhum. Se o padrão resolver para nenhum modelo disponível, a requisição falha com um erro claro. Você pode definir um padrão no painel se quiser uma rede de segurança.

Você pode ver e editar seu Roteador automático no painel em Routing. Pode estreitar o padrão (ex.: restringir a openai/*), trocar a estratégia, definir um default_model ou deletar o roteador inteiramente — igual a qualquer roteador nomeado.

Trocando estratégias

O painel expõe quatro cartões de estratégia. Cheapest é o padrão semeado acima; escolha outro para mudar como orcarouter/auto resolve as escolhas:

Cartão	Enum de backend	O que faz
Cheapest	`cheapest`	Menor preço por token entre candidatos ativos. O padrão semeado.
Quality	`quality`	Maior pontuação de qualidade entre candidatos ativos, independentemente do preço.
Balanced	`balanced`	Escolhe uma opção de baixo custo que ainda atende a uma barra de qualidade; cai para a opção de maior qualidade se nada atender à barra. Padrão para novos roteadores que você cria.
Adaptive	`linucb` / `gated_adaptive`	Bandit contextual LinUCB por roteador que aprende com seu tráfego real para ponderar qualidade, custo, latência e confiabilidade por requisição. Dois sub-modos (Standard / Gated) — veja Roteadores nomeados.

O Adaptive precisa de um breve warm-up por modelo antes de começar a guiar as escolhas. Durante o warm-up ele se comporta como Balanced — isso é esperado, não um bug.

Quando preferir o Roteador automático em vez de nomes de modelo explícitos

Você não quer fixar em um modelo específico; quer o modelo de chat ativo mais barato a cada requisição.
Você está prototipando e não quer se preocupar com qual provedor está ativo.
Você quer que o roteamento do OrcaRouter “simplesmente funcione” sem pensar nisso.

Quando preferir nomes de modelo explícitos

Você precisa de saída determinística — escolher modelos diferentes em momentos diferentes mudará o estilo e a qualidade da geração.
Você está usando recursos específicos de um modelo (ex.: cache_control do Claude ou a geração nativa de imagem de um modelo).
Você quer custo previsível por requisição.

Vendo o que o Roteador automático escolheu

Verifique o cabeçalho de resposta X-Orca-Resolved-Model. Veja Cabeçalhos de resposta.

res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# ex.: "openai/gpt-4o-mini"

​Uso

​Comportamento padrão

​Trocando estratégias

​Quando preferir o Roteador automático em vez de nomes de modelo explícitos

​Quando preferir nomes de modelo explícitos

​Vendo o que o Roteador automático escolheu

Uso

Comportamento padrão

Trocando estratégias

Quando preferir o Roteador automático em vez de nomes de modelo explícitos

Quando preferir nomes de modelo explícitos

Vendo o que o Roteador automático escolheu