チャットコンプリーションを作成
OpenAI 互換のチャットコンプリーション。サポート:
- ストリーミング (
stream: true、SSE) - ツール / 関数呼び出し (
tools、tool_choice) - 構造化出力 (
response_format) - マルチモーダル ——
content: [{type: "image_url", ...}]で画像を送信 (下のChatMessageContentPartスキーマを参照)。https://URL はすべてのビジョン対応モデルで動作; OrcaRouter の変換層が各上流 (OpenAI、Anthropic、Google、xAI Grok) 向け に content part を適合させます。 extra_body.models経由の OrcaRouter フォールバックチェーン。
プロバイダプレフィックス付きモデル名 (openai/gpt-4o-mini、
anthropic/claude-sonnet-4.6、google/gemini-2.5-flash)、
利用可能な場合の素のエイリアス、または名前付きルーター
(orcarouter/auto) を使用。
承認
OrcaRouter API キーは sk-orca-... のような形式です。
Authorization: Bearer sk-orca-... ヘッダで渡してください。
ボディ
モデル ID。3 つの形式をサポート:
- プロバイダプレフィックス付き (既定):
openai/gpt-4o-mini、anthropic/claude-sonnet-4.6、google/gemini-2.5-flash - 素のエイリアス:
gpt-4o-mini(素のエイリアスが利用可能なとき) - 名前付きルーター:
orcarouter/{name}(リクエスト時にモデルに解決;orcarouter/autoはすべてのアカウントで登録時にシードされ、最安のライブチャットモデルを選ぶ)
"gpt-4o"
"openai/gpt-4o"
"orcarouter/auto"
true のとき、レスポンスは server-sent events として流れる。
stream: true のときのみ適用。
auto, none, required - Text (default)
- JSON mode
- JSON Schema
0 <= x <= 20 <= x <= 1x >= 1推論モデルでは max_tokens より優先。
x >= 1決定論的サンプリング用。
0 <= x <= 20-2 <= x <= 2-2 <= x <= 2OpenAI 推論モデル (o1、o3*、o4*、gpt-5*-pro 等) 用。
Anthropic Claude は代わりに thinking フィールドを使う;
Gemini はプロバイダ固有設定を使う。
low, medium, high Chat Completions リクエストでウェブ検索を有効化。Responses
API は代わりに tools: [{"type": "web_search"}] を使う。
OpenAI 検索プレビューモデル、現代の web_search ツールを
受け付ける OpenAI モデル、Anthropic モデル (Anthropic
ネイティブの web_search サーバツールに変換) が認識する。
web_search_options が十分に表現的でないときに、上流の
web-search ツールに転送される自由形式の生ペイロード。
ほとんどのユーザーは web_search_options を優先する
べきです。
OrcaRouter 固有のリクエスト拡張。チャットコンプリーションリクエストの
トップレベル extra_body キー配下に配置してください。
