Forma OpenAI: /v1/audio/speech
Usa questo con la famiglia di modelli TTS di OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts e simili:
Content-Type indica quale
formato l’upstream ha restituito (audio/mpeg, audio/wav,
audio/opus o audio/flac).
Gemini TTS: /v1beta/ nativo
I modelli TTS in anteprima di Gemini (es. google/gemini-2.5-flash-preview-tts)
non sono serviti su /v1/audio/speech — chiamali invece tramite la
superficie nativa di Gemini:
inlineData
della risposta. Vedi la documentazione di Gemini TTS di Google per
l’insieme completo di nomi di voce e opzioni di configurazione.
Vedi anche
- Riferimento API / Audio — schema completo con try-it
- Formati nativi / Gemini
- Avanzato / Input audio — invio di audio A un modello di chat
