自动路由器 - OrcaRouter

orcarouter/auto 是我们为每个新账户自动创建的命名路由器。它在每次请求时把请求路由到你账户能访问的最便宜的在线 chat 模型，按请求实时挑选。

用法

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)

无需其他设置——账户创建那一刻，这个路由器就存在了。

默认行为

预置配置：

Pattern：空——匹配你账户能访问的所有 chat 模型。新上线的模型会自动成为候选。
Strategy：cheapest —— 在在线候选中挑每 token 单价最低的模型。
默认模型：无。若 pattern 解析为没有任何可用模型，请求会以清晰的错误失败。你可以在控制台为它设置一个默认模型作为兜底。

你可以在控制台的 Routing 里查看并编辑 Auto Router。可以收紧 pattern（例如限定 openai/*）、更换策略、设置 default_model、或者直接删除——和任何命名路由器一样。

切换策略

控制台暴露四张策略卡。Cheapest 是上文的预置默认；挑别的即可改变 orcarouter/auto 的解析行为：

策略卡	后端枚举	含义
Cheapest	`cheapest`	在在线候选中挑每 token 单价最低的模型。预置默认。
Quality	`quality`	在在线候选中挑质量分最高的模型，不计价格。
Balanced	`balanced`	挑选满足质量门槛的低成本选项；若无人达到门槛，则回退到质量最高的选项。你自己新建路由器时的默认值。
Adaptive	`linucb` / `gated_adaptive`	按路由器维度的 LinUCB 上下文 bandit，从你真实流量学习，在每次请求上权衡质量、成本、延迟和可靠性。两个子模式（Standard / Gated）—— 见命名路由器。

Adaptive 需要一段短暂的逐模型预热，再开始引导挑选。预热期间行为类似 Balanced——这是预期，不是 bug。

什么时候用 Auto Router 而不是显式模型名

你不想钉死在某个特定模型上；你想每次请求都用最便宜的在线 chat 模型。
你在做原型验证，不想关心哪家服务商是在线的。
你想让 OrcaRouter 的路由”开箱即用”，无需思考。

什么时候用显式模型名

你需要确定性输出——在不同时间挑不同模型会改变生成风格与质量。
你在使用某个模型独有的特性（如 Claude 的 cache_control，或某个模型原生的图像生成）。
你需要可预测的逐请求成本。

查看 Auto Router 挑了什么

查看 X-Orca-Resolved-Model 响应头。详见响应头。

res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# 例如 "openai/gpt-4o-mini"

​用法

​默认行为

​切换策略

​什么时候用 Auto Router 而不是显式模型名

​什么时候用显式模型名

​查看 Auto Router 挑了什么

用法

默认行为

切换策略

什么时候用 Auto Router 而不是显式模型名

什么时候用显式模型名

查看 Auto Router 挑了什么