Định dạng OpenAI: /v1/audio/speech
Dùng cho họ mô hình TTS của OpenAI — openai/tts-1,
openai/tts-1-hd, openai/gpt-4o-mini-tts và tương tự:
Content-Type cho biết định
dạng mà upstream đã trả về (audio/mpeg, audio/wav, audio/opus,
hoặc audio/flac).
Gemini TTS: /v1beta/ bản địa
Các mô hình TTS preview của Gemini (ví dụ
google/gemini-2.5-flash-preview-tts) không được phục vụ trên
/v1/audio/speech — hãy gọi chúng qua bề mặt bản địa của Gemini:
inlineData của phản hồi. Xem tài liệu Gemini TTS của Google để biết
toàn bộ tên giọng và tùy chọn cấu hình.
Xem thêm
- Tham chiếu API / Audio — lược đồ đầy đủ kèm try-it
- Định dạng gốc / Gemini
- Nâng cao / Đầu vào âm thanh — gửi âm thanh ĐẾN một mô hình chat
