响应头 - OrcaRouter

OrcaRouter 在每次 API 响应中加入少量响应头，便于你查看请求被如何路由。它们告诉你哪个模型承接了这次调用（用的就是你作为 model 传入的那种带服务商前缀的格式）；它们不暴露内部路由细节，如通道标识或上游后端 URL。

响应头	出现条件	示例	含义
`X-Orca-Fallback-Level`	`extra_body.models` 触发了回退	`1`	你回退链中实际承接响应的零基序号。`0` 表示主模型成功，回退未触发。
`X-Orca-Fallback-Model`	回退触发（level > 0）	`google/gemini-2.5-pro`	主模型失败后实际承接响应的模型。
`X-Orca-Router`	你调用了 `orcarouter/{name}`	`auto`	你调用的路由器名。
`X-Orca-Resolved-Model`	你调用了 `orcarouter/{name}`	`openai/gpt-4o-mini`	路由器在请求时解析到的具体模型。
`Retry-After`	响应是 `429 Too Many Requests`	`5`	重试前应等待的秒数。

在代码中读取

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

OrcaRouter 不会暴露什么

我们刻意不加入：

provider 或 routed_to 响应头/字段
任何内部路由标识或上游后端 URL
任何告诉调用方哪个上游承接了请求的响应头

从你应用的视角看，OrcaRouter 是单一服务商。内部路由是我们要操心的事，不是你需要依赖的东西。

​在代码中读取

​OrcaRouter 不会暴露什么

在代码中读取

OrcaRouter 不会暴露什么