stream: true, чтобы получать токены инкрементально как
Server-Sent Events вместо одного финального ответа. Задержка до
первого токена сокращается до одного сетевого round-trip.
OpenAI-совместимо (Chat / Responses)
data: {...}. Поток заканчивается data: [DONE].
Чтобы получить финальный объект usage внутри потока, передайте
stream_options: { include_usage: true } — фрагмент непосредственно
перед [DONE] будет содержать счётчики токенов.
Anthropic Messages
Anthropic использует именованные SSE-события. На первоклассной Anthropic-поверхности OrcaRouter полный набор, который испускает Anthropic, проходит напрямую:data: {...}.
Ошибки во время потока
Ошибки, возникшие посреди потока, не могут использовать HTTP-коды статуса (статус был отправлен при открытии потока). См. Operations / Ошибки для in-band форматов ошибок.Потоковая передача и резервирование
Как только хотя бы один байт ответа отправлен клиенту, OrcaRouter больше не может выполнить переход к следующему элементу цепочки — см. оговорку о потоковой передаче в Резервные модели.Дальнейшие шаги
Вызов инструментов
Потоковая передача дельт вызовов инструментов по мере их поступления.
Ошибки
Обработка сбоев посреди потока.
