テキスト読み上げ

OrcaRouter は使用したい TTS モデルのプロバイダに応じて 2 つのパスを公開します。

OpenAI 形式: `/v1/audio/speech`

OpenAI の TTS モデルファミリー —— openai/tts-1、openai/tts-1-hd、 openai/gpt-4o-mini-tts などで使います:

curl https://api.orcarouter.ai/v1/audio/speech \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello, world!",
    "voice": "alloy"
  }' \
  --output speech.mp3

レスポンスはバイナリ音声です。Content-Type ヘッダが上流から返ってきたフォーマットを示します (audio/mpeg、audio/wav、audio/opus、 audio/flac)。

Gemini TTS: ネイティブ `/v1beta/`

Gemini TTS プレビューモデル (google/gemini-2.5-flash-preview-tts など) は /v1/audio/speech で提供されません ——代わりに Gemini のネイティブインターフェースを使います:

curl "https://api.orcarouter.ai/v1beta/models/google/gemini-2.5-flash-preview-tts:generateContent" \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello, world!"}]}],
    "generationConfig": {
      "responseModalities": ["AUDIO"],
      "speechConfig": {
        "voiceConfig": {"prebuiltVoiceConfig": {"voiceName": "Kore"}}
      }
    }
  }'

音声バイトはレスポンスの inlineData フィールドに base64 で含まれます。利用可能な音声名と設定オプションの全リストは Google の Gemini TTS ドキュメントを参照してください。

​OpenAI 形式: /v1/audio/speech

​Gemini TTS: ネイティブ /v1beta/

​関連項目

OpenAI 形式: `/v1/audio/speech`

Gemini TTS: ネイティブ `/v1beta/`

関連項目