Saltar para o conteúdo principal
O OrcaRouter adiciona um pequeno número de cabeçalhos a toda resposta de API para que você possa inspecionar como sua requisição foi roteada. Eles dizem qual modelo serviu a chamada (no mesmo formato com prefixo de provedor que você passaria como model); eles não expõem detalhes internos de roteamento como identificadores de canal ou URLs de backend upstream.
CabeçalhoPresente quandoExemploSignificado
X-Orca-Fallback-Levelextra_body.models causou um fallback1Posição com índice zero na sua cadeia de fallback que serviu a resposta. 0 significa que o modelo principal teve sucesso e o fallback não foi acionado.
X-Orca-Fallback-ModelFallback acionado (nível > 0)google/gemini-2.5-proO modelo que realmente serviu a resposta depois que o principal falhou.
X-Orca-RouterVocê chamou orcarouter/{name}autoO nome do roteador que você invocou.
X-Orca-Resolved-ModelVocê chamou orcarouter/{name}openai/gpt-4o-miniO modelo concreto para o qual o roteador resolveu no momento da requisição.
Retry-AfterA resposta é 429 Too Many Requests5Quantos segundos esperar antes de tentar novamente.

Lendo-os no código

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

O que o OrcaRouter não expõe

Deliberadamente não adicionamos:
  • Um cabeçalho ou campo de resposta provider ou routed_to
  • Qualquer identificador interno de roteamento ou URL de backend upstream
  • Qualquer cabeçalho que diga a um chamador qual upstream serviu a requisição
O OrcaRouter é um único provedor do ponto de vista da sua aplicação. Roteamento interno é nossa preocupação, não sua dependência.