Cabeceras de respuesta

OrcaRouter añade un pequeño número de cabeceras a cada respuesta de la API para que puedas inspeccionar cómo se enrutó tu solicitud. Te dicen qué modelo sirvió la llamada (en el mismo formato con prefijo de proveedor que pasarías como model); no exponen detalles de enrutamiento interno como identificadores de canal o URL de backend upstream.

Cabecera	Presente cuando	Ejemplo	Significado
`X-Orca-Fallback-Level`	`extra_body.models` causó un respaldo	`1`	Posición indexada desde cero en tu cadena de respaldo que sirvió la respuesta. `0` significa que el modelo principal tuvo éxito y el respaldo no se activó.
`X-Orca-Fallback-Model`	Respaldo activado (nivel > 0)	`google/gemini-2.5-pro`	El modelo que realmente sirvió la respuesta después de que el principal fallara.
`X-Orca-Router`	Llamaste a `orcarouter/{name}`	`auto`	El nombre del enrutador que invocaste.
`X-Orca-Resolved-Model`	Llamaste a `orcarouter/{name}`	`openai/gpt-4o-mini`	El modelo concreto al que el enrutador se resolvió en el momento de la solicitud.
`Retry-After`	La respuesta es `429 Too Many Requests`	`5`	Cuántos segundos esperar antes de reintentar.

Leerlas en código

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Lo que OrcaRouter no expone

Deliberadamente no añadimos:

Una cabecera o campo de respuesta provider o routed_to
Ningún identificador de enrutamiento interno o URL de backend upstream
Ninguna cabecera que diga a un llamante qué upstream sirvió la solicitud

OrcaRouter es un solo proveedor desde el punto de vista de tu aplicación. El enrutamiento interno es nuestro asunto, no tu dependencia.

Enrutador Automático Límites de tasa

​Leerlas en código

​Lo que OrcaRouter no expone

Leerlas en código

Lo que OrcaRouter no expone