跳转到主要内容
OrcaRouter 在每次 API 响应中加入少量响应头,便于你查看请求被如何 路由。它们告诉你哪个模型承接了这次调用(用的就是你作为 model 传 入的那种带服务商前缀的格式);它们暴露内部路由细节,如通道 标识或上游后端 URL。
响应头出现条件示例含义
X-Orca-Fallback-Levelextra_body.models 触发了回退1你回退链中实际承接响应的零基序号。0 表示主模型成功,回退未触发。
X-Orca-Fallback-Model回退触发(level > 0)google/gemini-2.5-pro主模型失败后实际承接响应的模型。
X-Orca-Router你调用了 orcarouter/{name}auto你调用的路由器名。
X-Orca-Resolved-Model你调用了 orcarouter/{name}openai/gpt-4o-mini路由器在请求时解析到的具体模型。
Retry-After响应是 429 Too Many Requests5重试前应等待的秒数。

在代码中读取

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

OrcaRouter 不会暴露什么

我们刻意不加入:
  • providerrouted_to 响应头/字段
  • 任何内部路由标识或上游后端 URL
  • 任何告诉调用方哪个上游承接了请求的响应头
从你应用的视角看,OrcaRouter 是单一服务商。内部路由是我们要操心的 事,不是你需要依赖的东西。