メインコンテンツへスキップ
OrcaRouter はリクエストがどうルーティングされたかを確認できるよう、 すべての API レスポンスに少数のヘッダを追加します。これらは、 どのモデルが呼び出しを処理したかを (あなたが model として渡すのと 同じプロバイダプレフィックス付き形式で) 伝えます; チャネル識別子や 上流バックエンド URL などの内部ルーティングの詳細は公開しません。
ヘッダ設定タイミング意味
X-Orca-Fallback-Levelextra_body.models がフォールバックを発動1フォールバックチェーン内でレスポンスを処理した 0 基準の位置。0 は主モデルが成功し、フォールバックが発動しなかったことを意味します。
X-Orca-Fallback-Modelフォールバックが発動 (level > 0)google/gemini-2.5-pro主モデルが失敗した後、実際にレスポンスを処理したモデル。
X-Orca-Routerorcarouter/{name} を呼び出したauto呼び出したルーターの名前。
X-Orca-Resolved-Modelorcarouter/{name} を呼び出したopenai/gpt-4o-miniルーターがリクエスト時に解決した具体的なモデル。
Retry-Afterレスポンスが 429 Too Many Requests5再試行までに待つ秒数。

コードでの読み取り

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

OrcaRouter が公開しないもの

意図的に追加しません:
  • provider または routed_to ヘッダ/レスポンスフィールド
  • 内部ルーティング識別子や上流バックエンド URL
  • どの上流がリクエストを処理したかを呼び出し側に伝えるヘッダ
OrcaRouter はアプリの観点からは単一のプロバイダです。内部ルーティング は私たちの関心事であって、あなたが依存すべきものではありません。