レスポンスヘッダ

OrcaRouter はリクエストがどうルーティングされたかを確認できるよう、すべての API レスポンスに少数のヘッダを追加します。これらは、どのモデルが呼び出しを処理したかを (あなたが model として渡すのと同じプロバイダプレフィックス付き形式で) 伝えます; チャネル識別子や上流バックエンド URL などの内部ルーティングの詳細は公開しません。

ヘッダ	設定タイミング	例	意味
`X-Orca-Fallback-Level`	`extra_body.models` がフォールバックを発動	`1`	フォールバックチェーン内でレスポンスを処理した 0 基準の位置。`0` は主モデルが成功し、フォールバックが発動しなかったことを意味します。
`X-Orca-Fallback-Model`	フォールバックが発動 (level > 0)	`google/gemini-2.5-pro`	主モデルが失敗した後、実際にレスポンスを処理したモデル。
`X-Orca-Router`	`orcarouter/{name}` を呼び出した	`auto`	呼び出したルーターの名前。
`X-Orca-Resolved-Model`	`orcarouter/{name}` を呼び出した	`openai/gpt-4o-mini`	ルーターがリクエスト時に解決した具体的なモデル。
`Retry-After`	レスポンスが `429 Too Many Requests`	`5`	再試行までに待つ秒数。

コードでの読み取り

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

OrcaRouter が公開しないもの

意図的に追加しません:

provider または routed_to ヘッダ/レスポンスフィールド
内部ルーティング識別子や上流バックエンド URL
どの上流がリクエストを処理したかを呼び出し側に伝えるヘッダ

OrcaRouter はアプリの観点からは単一のプロバイダです。内部ルーティングは私たちの関心事であって、あなたが依存すべきものではありません。

オートルーターレート制限

​コードでの読み取り

​OrcaRouter が公開しないもの

コードでの読み取り

OrcaRouter が公開しないもの