OpenAI 形式: /v1/audio/speech
OpenAI の TTS モデルファミリー —— openai/tts-1、openai/tts-1-hd、
openai/gpt-4o-mini-tts などで使います:
Content-Type ヘッダが上流から返って
きたフォーマットを示します (audio/mpeg、audio/wav、audio/opus、
audio/flac)。
Gemini TTS: ネイティブ /v1beta/
Gemini TTS プレビューモデル (google/gemini-2.5-flash-preview-tts
など) は /v1/audio/speech で提供されません ——代わりに Gemini の
ネイティブインターフェースを使います:
inlineData フィールドに base64 で含まれ
ます。利用可能な音声名と設定オプションの全リストは Google の
Gemini TTS ドキュメントを参照してください。
関連項目
- API リファレンス / Audio — 完全なスキーマと試用
- ネイティブ形式 / Gemini
- 高度な機能 / 音声入力 — チャットモデルへの音声送信
