stream: true를 설정하면 하나의 완성된 응답이 아니라 Server-Sent
Events로 증분 토큰을 받게 됩니다. 첫 토큰까지의 지연이 단일
네트워크 왕복으로 줄어듭니다.
OpenAI 호환 (Chat / Responses)
data: {...}입니다. 스트림은 data: [DONE]으로 끝납니다.
스트림 내에서 최종 usage 객체를 얻으려면
stream_options: { include_usage: true }를 전달하세요 — [DONE]
직전의 청크에 토큰 수가 포함됩니다.
Anthropic Messages
Anthropic은 명명된 SSE 이벤트를 사용합니다. OrcaRouter의 일급 Anthropic 인터페이스에서 Anthropic이 발행하는 전체 이벤트가 직접 흐릅니다:data: {...} JSON 줄이 따릅니다.
스트림 중 오류
스트림에서 발생한 오류는 HTTP 상태 코드를 사용할 수 없습니다 (상태는 스트림이 열릴 때 이미 전송됨). 인밴드 오류 형태는 운영 / 오류를 참조하세요.스트리밍과 폴백
응답의 첫 바이트라도 클라이언트로 전송되면 OrcaRouter는 더 이상 다음 체인 항목으로 폴백할 수 없습니다 — 모델 폴백의 스트리밍 주의 사항을 참조하세요.다음 단계
도구 호출
도구 호출 델타를 스트림으로 받습니다.
오류
스트림 중 실패를 처리합니다.
