Kształt OpenAI: /v1/audio/speech
Użyj jej z rodziną modeli TTS OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts itp.:
Content-Type mówi, jaki format
zwrócił upstream (audio/mpeg, audio/wav, audio/opus lub
audio/flac).
Gemini TTS: natywne /v1beta/
Modele preview Gemini TTS (np. google/gemini-2.5-flash-preview-tts)
nie są obsługiwane na /v1/audio/speech — wywołaj je przez natywną
powierzchnię Gemini:
inlineData odpowiedzi.
Zobacz dokumentację Gemini TTS od Google, aby poznać pełny zestaw nazw
głosów i opcji konfiguracji.
Zobacz także
- Dokumentacja API / Audio — pełny schemat z try-it
- Formaty natywne / Gemini
- Zaawansowane / Wejście audio — wysyłanie audio DO modelu chat
