Cabeçalhos de resposta

O OrcaRouter adiciona um pequeno número de cabeçalhos a toda resposta de API para que você possa inspecionar como sua requisição foi roteada. Eles dizem qual modelo serviu a chamada (no mesmo formato com prefixo de provedor que você passaria como model); eles não expõem detalhes internos de roteamento como identificadores de canal ou URLs de backend upstream.

Cabeçalho	Presente quando	Exemplo	Significado
`X-Orca-Fallback-Level`	`extra_body.models` causou um fallback	`1`	Posição com índice zero na sua cadeia de fallback que serviu a resposta. `0` significa que o modelo principal teve sucesso e o fallback não foi acionado.
`X-Orca-Fallback-Model`	Fallback acionado (nível > 0)	`google/gemini-2.5-pro`	O modelo que realmente serviu a resposta depois que o principal falhou.
`X-Orca-Router`	Você chamou `orcarouter/{name}`	`auto`	O nome do roteador que você invocou.
`X-Orca-Resolved-Model`	Você chamou `orcarouter/{name}`	`openai/gpt-4o-mini`	O modelo concreto para o qual o roteador resolveu no momento da requisição.
`Retry-After`	A resposta é `429 Too Many Requests`	`5`	Quantos segundos esperar antes de tentar novamente.

Lendo-os no código

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

O que o OrcaRouter não expõe

Deliberadamente não adicionamos:

Um cabeçalho ou campo de resposta provider ou routed_to
Qualquer identificador interno de roteamento ou URL de backend upstream
Qualquer cabeçalho que diga a um chamador qual upstream serviu a requisição

O OrcaRouter é um único provedor do ponto de vista da sua aplicação. Roteamento interno é nossa preocupação, não sua dependência.

​Lendo-os no código

​O que o OrcaRouter não expõe

Lendo-os no código

O que o OrcaRouter não expõe