orcarouter/auto 是我们为每个新账户自动创建的命名路由器。
它在每次请求时把请求路由到你账户能访问的最便宜的在线 chat 模型,
按请求实时挑选。
用法
默认行为
预置配置:- Pattern:空——匹配你账户能访问的所有 chat 模型。新上线的 模型会自动成为候选。
- Strategy:
cheapest—— 在在线候选中挑每 token 单价最低的模型。 - 默认模型:无。若 pattern 解析为没有任何可用模型,请求会以 清晰的错误失败。你可以在控制台为它设置一个默认模型作为兜底。
openai/*)、更换策略、设置 default_model、
或者直接删除——和任何命名路由器一样。
切换策略
控制台暴露四张策略卡。Cheapest 是上文的预置默认;挑别的即可改变orcarouter/auto 的解析行为:
| 策略卡 | 后端枚举 | 含义 |
|---|---|---|
| Cheapest | cheapest | 在在线候选中挑每 token 单价最低的模型。预置默认。 |
| Quality | quality | 在在线候选中挑质量分最高的模型,不计价格。 |
| Balanced | balanced | 挑选满足质量门槛的低成本选项;若无人达到门槛,则回退到质量最高的选项。你自己新建路由器时的默认值。 |
| Adaptive | linucb / gated_adaptive | 按路由器维度的 LinUCB 上下文 bandit,从你真实流量学习,在每次请求上权衡质量、成本、延迟和可靠性。两个子模式(Standard / Gated)—— 见命名路由器。 |
什么时候用 Auto Router 而不是显式模型名
- 你不想钉死在某个特定模型上;你想每次请求都用最便宜的在线 chat 模型。
- 你在做原型验证,不想关心哪家服务商是在线的。
- 你想让 OrcaRouter 的路由”开箱即用”,无需思考。
什么时候用显式模型名
- 你需要确定性输出——在不同时间挑不同模型会改变生成风格与质量。
- 你在使用某个模型独有的特性(如 Claude 的
cache_control,或某个 模型原生的图像生成)。 - 你需要可预测的逐请求成本。
查看 Auto Router 挑了什么
查看X-Orca-Resolved-Model 响应头。详见响应头。
