Przejdź do głównej treści
Ustaw stream: true, aby otrzymywać tokeny przyrostowo jako Server-Sent Events zamiast jednej finalnej odpowiedzi. Opóźnienie do pierwszego tokenu spada do jednej rundy sieciowej.

Zgodne z OpenAI (Chat / Responses)

curl -N https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [{"role":"user","content":"Tell me a haiku."}],
    "stream": true
  }'
Każda linia to data: {...}. Strumień kończy się data: [DONE]. Aby otrzymać finalny obiekt usage wewnątrz strumienia, przekaż stream_options: { include_usage: true } — fragment tuż przed [DONE] zawiera liczbę tokenów.

Anthropic Messages

Anthropic używa nazwanych zdarzeń SSE. Na pierwszorzędnej powierzchni Anthropic w OrcaRouter pełny zestaw, który emituje Anthropic, przechodzi bezpośrednio:
event: message_start
event: content_block_start
event: ping
event: content_block_delta
event: content_block_stop
event: message_delta
event: message_stop
Po każdym zdarzeniu następuje linia JSON data: {...}.
curl -N https://api.orcarouter.ai/v1/messages \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "anthropic/claude-sonnet-4.6",
    "max_tokens": 256,
    "messages": [{"role":"user","content":"Tell me a haiku."}],
    "stream": true
  }'

Błędy w trakcie strumienia

Błędy emitowane w trakcie strumienia nie mogą używać kodów statusu HTTP (status został wysłany przy otwarciu strumienia). Zobacz Operacje / Błędy, aby poznać kształty błędów in-band.

Streaming a fallback

Gdy choć jeden bajt odpowiedzi został wysłany do klienta, OrcaRouter nie może już przełączyć się na kolejny wpis łańcucha — zobacz uwagę o streamingu w Fallbacki modeli.

Następne kroki

Tool calling

Strumieniuj delty wywołań narzędzi, jak nadchodzą.

Błędy

Obsługuj awarie w środku strumienia.