Формат OpenAI: /v1/audio/speech
Используется с семейством TTS-моделей OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts и аналогичными:
Content-Type сообщает,
в каком формате апстрим вернул данные (audio/mpeg, audio/wav,
audio/opus или audio/flac).
Gemini TTS: нативный /v1beta/
Превью TTS-модели Gemini (например, google/gemini-2.5-flash-preview-tts)
не обслуживаются по /v1/audio/speech — обращайтесь к ним через нативный
интерфейс Gemini:
inlineData ответа.
Полный набор имён голосов и параметров конфигурации см. в документации
Google Gemini TTS.
См. также
- Справочник API / Audio — полная схема с try-it
- Нативные форматы / Gemini
- Расширенные возможности / Аудио на входе — отправка аудио В чат-модель
