跳转到主要内容
orcarouter/auto 是我们为每个新账户自动创建的命名路由器。 它在每次请求时把请求路由到你账户能访问的最便宜的在线 chat 模型, 按请求实时挑选。

用法

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)
无需其他设置——账户创建那一刻,这个路由器就存在了。

默认行为

预置配置:
  • Pattern:空——匹配你账户能访问的所有 chat 模型。新上线的 模型会自动成为候选。
  • Strategycheapest —— 在在线候选中挑每 token 单价最低的模型。
  • 默认模型:无。若 pattern 解析为没有任何可用模型,请求会以 清晰的错误失败。你可以在控制台为它设置一个默认模型作为兜底。
你可以在控制台的 Routing 里查看并编辑 Auto Router。可以收紧 pattern(例如限定 openai/*)、更换策略、设置 default_model、 或者直接删除——和任何命名路由器一样。

切换策略

控制台暴露四张策略卡。Cheapest 是上文的预置默认;挑别的即可改变 orcarouter/auto 的解析行为:
策略卡后端枚举含义
Cheapestcheapest在在线候选中挑每 token 单价最低的模型。预置默认。
Qualityquality在在线候选中挑质量分最高的模型,不计价格。
Balancedbalanced挑选满足质量门槛的低成本选项;若无人达到门槛,则回退到质量最高的选项。你自己新建路由器时的默认值。
Adaptivelinucb / gated_adaptive按路由器维度的 LinUCB 上下文 bandit,从你真实流量学习,在每次请求上权衡质量、成本、延迟和可靠性。两个子模式(Standard / Gated)—— 见命名路由器
Adaptive 需要一段短暂的逐模型预热,再开始引导挑选。预热期间行为 类似 Balanced——这是预期,不是 bug。

什么时候用 Auto Router 而不是显式模型名

  • 你不想钉死在某个特定模型上;你想每次请求都用最便宜的在线 chat 模型。
  • 你在做原型验证,不想关心哪家服务商是在线的。
  • 你想让 OrcaRouter 的路由”开箱即用”,无需思考。

什么时候用显式模型名

  • 你需要确定性输出——在不同时间挑不同模型会改变生成风格与质量。
  • 你在使用某个模型独有的特性(如 Claude 的 cache_control,或某个 模型原生的图像生成)。
  • 你需要可预测的逐请求成本。

查看 Auto Router 挑了什么

查看 X-Orca-Resolved-Model 响应头。详见响应头
res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# 例如 "openai/gpt-4o-mini"