Saltar al contenido principal
OrcaRouter añade un pequeño número de cabeceras a cada respuesta de la API para que puedas inspeccionar cómo se enrutó tu solicitud. Te dicen qué modelo sirvió la llamada (en el mismo formato con prefijo de proveedor que pasarías como model); no exponen detalles de enrutamiento interno como identificadores de canal o URL de backend upstream.
CabeceraPresente cuandoEjemploSignificado
X-Orca-Fallback-Levelextra_body.models causó un respaldo1Posición indexada desde cero en tu cadena de respaldo que sirvió la respuesta. 0 significa que el modelo principal tuvo éxito y el respaldo no se activó.
X-Orca-Fallback-ModelRespaldo activado (nivel > 0)google/gemini-2.5-proEl modelo que realmente sirvió la respuesta después de que el principal fallara.
X-Orca-RouterLlamaste a orcarouter/{name}autoEl nombre del enrutador que invocaste.
X-Orca-Resolved-ModelLlamaste a orcarouter/{name}openai/gpt-4o-miniEl modelo concreto al que el enrutador se resolvió en el momento de la solicitud.
Retry-AfterLa respuesta es 429 Too Many Requests5Cuántos segundos esperar antes de reintentar.

Leerlas en código

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Lo que OrcaRouter no expone

Deliberadamente no añadimos:
  • Una cabecera o campo de respuesta provider o routed_to
  • Ningún identificador de enrutamiento interno o URL de backend upstream
  • Ninguna cabecera que diga a un llamante qué upstream sirvió la solicitud
OrcaRouter es un solo proveedor desde el punto de vista de tu aplicación. El enrutamiento interno es nuestro asunto, no tu dependencia.