En-têtes de réponse

OrcaRouter ajoute un petit nombre d’en-têtes à chaque réponse API afin que vous puissiez inspecter comment votre requête a été routée. Ils vous indiquent quel modèle a servi l’appel (dans le même format préfixé par fournisseur que vous passeriez comme model) ; ils n’exposent pas les détails de routage interne comme les identifiants de canal ou les URL backend amont.

En-tête	Présent quand	Exemple	Signification
`X-Orca-Fallback-Level`	`extra_body.models` a causé un fallback	`1`	Position indexée à zéro dans votre chaîne de fallback qui a servi la réponse. `0` signifie que le modèle principal a réussi et que le fallback ne s’est pas déclenché.
`X-Orca-Fallback-Model`	Fallback déclenché (niveau > 0)	`google/gemini-2.5-pro`	Le modèle qui a réellement servi la réponse après l’échec du principal.
`X-Orca-Router`	Vous avez appelé `orcarouter/{name}`	`auto`	Le nom du routeur que vous avez invoqué.
`X-Orca-Resolved-Model`	Vous avez appelé `orcarouter/{name}`	`openai/gpt-4o-mini`	Le modèle concret vers lequel le routeur s’est résolu au moment de la requête.
`Retry-After`	La réponse est `429 Too Many Requests`	`5`	Combien de secondes attendre avant de réessayer.

Les lire dans le code

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Ce qu’OrcaRouter n’expose pas

Nous n’ajoutons délibérément pas :

Un en-tête ou champ de réponse provider ou routed_to
Tout identifiant de routage interne ou URL backend amont
Tout en-tête qui indique à un appelant quel amont a servi la requête

OrcaRouter est un fournisseur unique du point de vue de votre application. Le routage interne est notre préoccupation, pas votre dépendance.

​Les lire dans le code

​Ce qu’OrcaRouter n’expose pas

Les lire dans le code

Ce qu’OrcaRouter n’expose pas