stream: true para recibir tokens incrementales como
Server-Sent Events en lugar de una respuesta final única. La latencia
hasta el primer token cae a un único viaje de ida y vuelta de red.
Compatible con OpenAI (Chat / Responses)
data: {...}. El flujo termina con data: [DONE].
Para obtener el objeto usage final dentro del flujo, pasa
stream_options: { include_usage: true } — el fragmento justo antes
de [DONE] incluirá los recuentos de tokens.
Anthropic Messages
Anthropic usa eventos SSE con nombre. En la superficie Anthropic de primera clase de OrcaRouter, todo el conjunto que emite Anthropic pasa directamente:data: {...}.
Errores durante un flujo
Los errores emitidos a mitad del flujo no pueden usar códigos de estado HTTP (el estado se envió cuando se abrió el flujo). Consulta Operaciones / Errores para las formas de errores en banda.Streaming y respaldo
Una vez que se haya enviado cualquier byte de la respuesta al cliente, OrcaRouter ya no puede recurrir a la siguiente entrada de la cadena — consulta la advertencia de streaming en Respaldo de modelos.Siguientes pasos
Llamadas a herramientas
Transmite deltas de llamadas a herramientas según llegan.
Errores
Maneja fallos a mitad del flujo.
