OpenAI 形态:/v1/audio/speech
用于 OpenAI 的 TTS 模型家族——openai/tts-1、openai/tts-1-hd、
openai/gpt-4o-mini-tts 等:
Content-Type 头会告诉你上游返回的具体格式
(audio/mpeg、audio/wav、audio/opus 或 audio/flac)。
Gemini TTS:原生 /v1beta/
Gemini TTS 预览模型(如 google/gemini-2.5-flash-preview-tts)不会
在 /v1/audio/speech 上提供——请改用 Gemini 原生接口:
inlineData 字段。完整的语音
名称与配置项请查阅 Google Gemini TTS 文档。
另见
- API 参考 / Audio — 完整 schema 与在线调试
- 原生格式 / Gemini
- 高级 / 音频输入 — 把音频送入对话模型
