OpenAI 형태: /v1/audio/speech
OpenAI의 TTS 모델 패밀리 — openai/tts-1, openai/tts-1-hd,
openai/gpt-4o-mini-tts 등과 함께 사용합니다:
Content-Type 헤더가 업스트림이
반환한 형식을 알려줍니다(audio/mpeg, audio/wav, audio/opus,
audio/flac).
Gemini TTS: 네이티브 /v1beta/
Gemini TTS 미리보기 모델(예: google/gemini-2.5-flash-preview-tts)
은 /v1/audio/speech에서 제공되지 않습니다 — 대신 Gemini 네이티브
인터페이스로 호출하세요:
inlineData 필드 내에 base64로 반환됩니다.
사용 가능한 음성 이름과 구성 옵션의 전체 세트는 Google의 Gemini
TTS 문서를 참조하세요.
관련 항목
- API 참조 / Audio — 완전한 스키마와 시도해보기
- 네이티브 형식 / Gemini
- 고급 기능 / 오디오 입력 — 채팅 모델로 오디오 보내기
