Как использовать
Поместите упорядоченный список идентификаторов моделей вextra_body.models
и установите extra_body.route в "fallback". Поле model верхнего уровня
по-прежнему важно — это первая попытка, — но OrcaRouter игнорирует его в
пользу цепочки, если она задана.
Правила
- Максимум 5 моделей в цепочке. Лишние молча отбрасываются.
- Рекомендация: все модели в цепочке должны быть одного типа эндпоинта
(все чат-модели или все image-модели). Смешивание чат-модели с image-моделью
не приведёт к падению шлюза, но резервная модель, которая фактически обслужит
запрос, должна соответствовать вызванному вами эндпоинту (например, если вы
вызвали
/v1/chat/completions, в цепочке могут использоваться только чат-модели). - Поведение резервирования:
- Неразрешимые записи
orcarouter/{name}(неверное имя, отключённый маршрутизатор) молча пропускаются. - Модели, к которым у вызывающего ключа нет доступа (несоответствие allowlist моделей), молча пропускаются.
- Когда основная модель отвечает ошибкой на стороне апстрима (5xx / 429 / сетевая ошибка), пробуется следующая запись в цепочке.
- Запрос завершается ошибкой только после того, как исчерпаны все записи цепочки.
- Особенность потоковой передачи: как только клиенту отправлен хотя бы один байт ответа, резервирование больше не активируется — если апстрим прервётся посреди потока, клиент увидит обрезанный поток, а не прозрачный повтор на следующей модели.
- Неразрешимые записи
- Тарификация осуществляется по модели, которая фактически обслужила ответ, по её тарифу — а не по тарифу основной модели.
extra_body.routeдолжно быть точно"fallback", чтобы цепочка активировалась. Любое другое значение (или отсутствие) → цепочка игнорируется и используется толькоmodelверхнего уровня.
Как узнать, какая модель обслужила ответ
Проверьте заголовки ответаX-Orca-Fallback-Level и X-Orca-Fallback-Model.
См. Заголовки ответа.
Когда это не нужно
Если вы хотите, чтобы OrcaRouter автоматически выбирал самую дешёвую доступную модель без написания цепочки, используйтеorcarouter/auto. Цепочки резервирования нужны,
когда вы хотите явный контроль над порядком.