Saltar al contenido principal
Configura stream: true para recibir tokens incrementales como Server-Sent Events en lugar de una respuesta final única. La latencia hasta el primer token cae a un único viaje de ida y vuelta de red.

Compatible con OpenAI (Chat / Responses)

curl -N https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [{"role":"user","content":"Tell me a haiku."}],
    "stream": true
  }'
Cada línea es data: {...}. El flujo termina con data: [DONE]. Para obtener el objeto usage final dentro del flujo, pasa stream_options: { include_usage: true } — el fragmento justo antes de [DONE] incluirá los recuentos de tokens.

Anthropic Messages

Anthropic usa eventos SSE con nombre. En la superficie Anthropic de primera clase de OrcaRouter, todo el conjunto que emite Anthropic pasa directamente:
event: message_start
event: content_block_start
event: ping
event: content_block_delta
event: content_block_stop
event: message_delta
event: message_stop
Cada evento va seguido de una línea JSON data: {...}.
curl -N https://api.orcarouter.ai/v1/messages \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "anthropic/claude-sonnet-4.6",
    "max_tokens": 256,
    "messages": [{"role":"user","content":"Tell me a haiku."}],
    "stream": true
  }'

Errores durante un flujo

Los errores emitidos a mitad del flujo no pueden usar códigos de estado HTTP (el estado se envió cuando se abrió el flujo). Consulta Operaciones / Errores para las formas de errores en banda.

Streaming y respaldo

Una vez que se haya enviado cualquier byte de la respuesta al cliente, OrcaRouter ya no puede recurrir a la siguiente entrada de la cadena — consulta la advertencia de streaming en Respaldo de modelos.

Siguientes pasos

Llamadas a herramientas

Transmite deltas de llamadas a herramientas según llegan.

Errores

Maneja fallos a mitad del flujo.