Formato OpenAI: /v1/audio/speech
Use este com a família de modelos TTS da OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts e similares:
Content-Type informa qual
formato o upstream retornou (audio/mpeg, audio/wav, audio/opus
ou audio/flac).
Gemini TTS: /v1beta/ nativo
Modelos preview de TTS do Gemini (ex.:
google/gemini-2.5-flash-preview-tts) não são servidos em
/v1/audio/speech — chame-os através da superfície nativa do Gemini:
inlineData da
resposta. Veja a documentação Gemini TTS do Google para o conjunto
completo de nomes de voz e opções de configuração.
Veja também
- Referência da API / Audio — esquema completo com teste ao vivo
- Formatos nativos / Gemini
- Avançado / Entrada de áudio — enviando áudio PARA um modelo de chat
