メインコンテンツへスキップ
OrcaRouter は使用したい TTS モデルのプロバイダに応じて 2 つの パスを公開します。

OpenAI 形式: /v1/audio/speech

OpenAI の TTS モデルファミリー —— openai/tts-1openai/tts-1-hdopenai/gpt-4o-mini-tts などで使います:
curl https://api.orcarouter.ai/v1/audio/speech \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello, world!",
    "voice": "alloy"
  }' \
  --output speech.mp3
レスポンスはバイナリ音声です。Content-Type ヘッダが上流から返って きたフォーマットを示します (audio/mpegaudio/wavaudio/opusaudio/flac)。

Gemini TTS: ネイティブ /v1beta/

Gemini TTS プレビューモデル (google/gemini-2.5-flash-preview-tts など) は /v1/audio/speech で提供されません ——代わりに Gemini の ネイティブインターフェースを使います:
curl "https://api.orcarouter.ai/v1beta/models/google/gemini-2.5-flash-preview-tts:generateContent" \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello, world!"}]}],
    "generationConfig": {
      "responseModalities": ["AUDIO"],
      "speechConfig": {
        "voiceConfig": {"prebuiltVoiceConfig": {"voiceName": "Kore"}}
      }
    }
  }'
音声バイトはレスポンスの inlineData フィールドに base64 で含まれ ます。利用可能な音声名と設定オプションの全リストは Google の Gemini TTS ドキュメントを参照してください。

関連項目