chat completion 생성
OpenAI 호환 chat completions. 지원:
- 스트리밍(
stream: true, SSE) - 도구 / 함수 호출(
tools,tool_choice) - 구조화 출력(
response_format) - 멀티모달 —
content: [{type: "image_url", ...}]로 이미지 보내기(아래ChatMessageContentPart스키마 참조).https://URL은 모든 비전 가능 모델에 대해 작동; OrcaRouter 의 변환층이 각 업스트림(OpenAI, Anthropic, Google, xAI Grok) 에 대해 컨텐츠 파트를 적응시킴. extra_body.models를 통한 OrcaRouter 폴백 체인.
프로바이더 접두사 모델 이름(openai/gpt-4o-mini,
anthropic/claude-sonnet-4.6, google/gemini-2.5-flash),
사용 가능한 경우 베어 이름 별칭, 또는 이름 지정 라우터
(orcarouter/auto)를 사용하세요.
인증
OrcaRouter API 키는 sk-orca-...처럼 보입니다.
Authorization: Bearer sk-orca-... 헤더로 전달하세요.
본문
모델 ID. 세 가지 형태 지원:
- 프로바이더 접두사(기본):
openai/gpt-4o-mini,anthropic/claude-sonnet-4.6,google/gemini-2.5-flash - 일반 별칭:
gpt-4o-mini(베어 이름 별칭이 사용 가능할 때) - 이름 지정 라우터:
orcarouter/{name}(요청 시간에 모델로 해결;orcarouter/auto는 모든 계정의 가입 시 시드되어 가장 저렴한 라이브 채팅 모델을 선택)
"gpt-4o"
"openai/gpt-4o"
"orcarouter/auto"
true일 때, 응답이 server-sent events로 스트리밍됨.
stream: true일 때만 적용.
auto, none, required - Text (default)
- JSON mode
- JSON Schema
0 <= x <= 20 <= x <= 1x >= 1추론 모델에서 max_tokens보다 선호됨.
x >= 1결정론적 샘플링용.
0 <= x <= 20-2 <= x <= 2-2 <= x <= 2OpenAI 추론 모델용(o1, o3*, o4*, gpt-5*-pro 등).
Anthropic Claude는 대신 thinking 필드를 사용;
Gemini는 프로바이더 고유 구성을 사용.
low, medium, high Chat Completions 요청에서 웹 검색 활성화. Responses
API는 대신 tools: [{"type": "web_search"}]를 사용.
OpenAI 검색 미리보기 모델, 현대 web_search 도구를
받는 OpenAI 모델, Anthropic 모델(Anthropic의 네이티브
web_search 서버 도구로 변환)에서 인식됨.
web_search_options가 충분히 표현적이지 않을 때 업스트림의
web-search 도구로 전달되는 자유 형식 원시 페이로드.
대부분의 사용자는 web_search_options를 선호해야 합니다.
OrcaRouter 고유 요청 확장. chat completion 요청의
최상위 extra_body 키 아래에 두세요.
