orcarouter/auto — это именованный маршрутизатор,
который мы создаём для каждого аккаунта при регистрации. Он направляет
каждый запрос к самой дешёвой живой чат-модели, к которой у вашего аккаунта
есть доступ, выбираемой заново для каждого запроса.
Использование
Поведение по умолчанию
Начальная конфигурация:- Pattern: пусто — соответствует каждой чат-модели, к которой у вашего аккаунта есть доступ. Новые модели, появляющиеся онлайн, автоматически становятся кандидатами.
- Strategy:
cheapest— выбирает модель с наименьшей ценой за токен среди живых кандидатов. - Default model: отсутствует. Если шаблон не разрешается ни в одну доступную модель, запрос завершается с понятной ошибкой. Вы можете установить значение по умолчанию в дашборде, если хотите иметь страховку.
openai/*),
изменить стратегию, установить default_model или полностью удалить
маршрутизатор — так же, как для любого именованного маршрутизатора.
Смена стратегий
Дашборд предоставляет четыре карточки стратегий. Cheapest — начальное значение по умолчанию выше; выберите другую, чтобы изменить, какorcarouter/auto разрешает выбор:
| Карточка | Backend enum | Что делает |
|---|---|---|
| Cheapest | cheapest | Наименьшая цена за токен среди живых кандидатов. Значение по умолчанию. |
| Quality | quality | Наивысший показатель качества среди живых кандидатов независимо от цены. |
| Balanced | balanced | Выбирает недорогой вариант, всё ещё соответствующий планке качества; возвращается к варианту с наивысшим качеством, если ничего не соответствует планке. По умолчанию для новых маршрутизаторов, которые вы создаёте сами. |
| Adaptive | linucb / gated_adaptive | Контекстный бандит LinUCB для маршрутизатора, обучающийся на реальном трафике для взвешивания качества, стоимости, задержки и надёжности на каждый запрос. Два подрежима (Standard / Gated) — см. Именованные маршрутизаторы. |
Когда предпочесть Auto Router явным именам моделей
- Вы не хотите привязываться к конкретной модели; вам нужна самая дешёвая живая чат-модель на каждый запрос.
- Вы прототипируете и не хотите задумываться о том, какой провайдер сейчас работает.
- Вы хотите, чтобы маршрутизация OrcaRouter «просто работала» без размышлений.
Когда предпочесть явные имена моделей
- Вам нужен детерминированный вывод — выбор разных моделей в разные моменты изменит стиль и качество генерации.
- Вы используете возможности, специфичные для одной модели (например,
cache_controlот Claude или нативную генерацию изображений модели). - Вам нужна предсказуемая стоимость каждого запроса.
Как узнать, что выбрал Auto Router
Проверьте заголовок ответаX-Orca-Resolved-Model. См.
Заголовки ответа.
