Forma OpenAI: /v1/audio/speech
Úsalo con la familia de modelos TTS de OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts, y similares:
Content-Type te dice qué
formato devolvió el upstream (audio/mpeg, audio/wav,
audio/opus, o audio/flac).
Gemini TTS: /v1beta/ nativo
Los modelos preview de Gemini TTS (p. ej.
google/gemini-2.5-flash-preview-tts) no se sirven en
/v1/audio/speech — invócalos a través de la superficie nativa de
Gemini en su lugar:
inlineData
de la respuesta. Consulta la documentación de Gemini TTS de Google
para el conjunto completo de nombres de voz y opciones de
configuración.
Véase también
- Referencia API / Audio — esquema completo con prueba en vivo
- Formatos nativos / Gemini
- Avanzado / Entrada de audio — enviar audio HACIA un modelo de chat
