OpenAI 形態:/v1/audio/speech
用于 OpenAI 的 TTS 模型家族——openai/tts-1、openai/tts-1-hd、
openai/gpt-4o-mini-tts 等:
Content-Type 頭會告訴你上游返回的具體格式
(audio/mpeg、audio/wav、audio/opus 或 audio/flac)。
Gemini TTS:原生 /v1beta/
Gemini TTS 預覽模型(如 google/gemini-2.5-flash-preview-tts)不會
在 /v1/audio/speech 上提供——請改用 Gemini 原生接口:
inlineData 字段。完整的語音
名稱與配置項請查閱 Google Gemini TTS 文檔。
另見
- API 參考 / Audio — 完整 schema 與在線調試
- 原生格式 / Gemini
- 高級 / 音頻輸入 — 把音頻送入對話模型
