Forme OpenAI : /v1/audio/speech
Utilisez-le avec la famille de modèles TTS d’OpenAI —
openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts, etc. :
Content-Type vous
indique le format que l’amont a retourné (audio/mpeg,
audio/wav, audio/opus, ou audio/flac).
Gemini TTS : /v1beta/ natif
Les modèles preview Gemini TTS (par ex.
google/gemini-2.5-flash-preview-tts) ne sont pas servis sur
/v1/audio/speech — appelez-les via la surface native de Gemini à
la place :
inlineData de
la réponse. Voir la documentation Gemini TTS de Google pour
l’ensemble complet des noms de voix et options de configuration.
Voir aussi
- Référence API / Audio — schéma complet avec essai en direct
- Formats natifs / Gemini
- Avancé / Entrée audio — envoyer de l’audio VERS un modèle de chat
