Passer au contenu principal
OrcaRouter ajoute un petit nombre d’en-têtes à chaque réponse API afin que vous puissiez inspecter comment votre requête a été routée. Ils vous indiquent quel modèle a servi l’appel (dans le même format préfixé par fournisseur que vous passeriez comme model) ; ils n’exposent pas les détails de routage interne comme les identifiants de canal ou les URL backend amont.
En-têtePrésent quandExempleSignification
X-Orca-Fallback-Levelextra_body.models a causé un fallback1Position indexée à zéro dans votre chaîne de fallback qui a servi la réponse. 0 signifie que le modèle principal a réussi et que le fallback ne s’est pas déclenché.
X-Orca-Fallback-ModelFallback déclenché (niveau > 0)google/gemini-2.5-proLe modèle qui a réellement servi la réponse après l’échec du principal.
X-Orca-RouterVous avez appelé orcarouter/{name}autoLe nom du routeur que vous avez invoqué.
X-Orca-Resolved-ModelVous avez appelé orcarouter/{name}openai/gpt-4o-miniLe modèle concret vers lequel le routeur s’est résolu au moment de la requête.
Retry-AfterLa réponse est 429 Too Many Requests5Combien de secondes attendre avant de réessayer.

Les lire dans le code

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Ce qu’OrcaRouter n’expose pas

Nous n’ajoutons délibérément pas :
  • Un en-tête ou champ de réponse provider ou routed_to
  • Tout identifiant de routage interne ou URL backend amont
  • Tout en-tête qui indique à un appelant quel amont a servi la requête
OrcaRouter est un fournisseur unique du point de vue de votre application. Le routage interne est notre préoccupation, pas votre dépendance.