텍스트 음성 변환

OrcaRouter는 사용하려는 TTS 모델 프로바이더에 따라 두 가지 경로를 노출합니다.

OpenAI 형태: `/v1/audio/speech`

OpenAI의 TTS 모델 패밀리 — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts 등과 함께 사용합니다:

curl https://api.orcarouter.ai/v1/audio/speech \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello, world!",
    "voice": "alloy"
  }' \
  --output speech.mp3

응답은 바이너리 오디오입니다. Content-Type 헤더가 업스트림이 반환한 형식을 알려줍니다(audio/mpeg, audio/wav, audio/opus, audio/flac).

Gemini TTS: 네이티브 `/v1beta/`

Gemini TTS 미리보기 모델(예: google/gemini-2.5-flash-preview-tts) 은 /v1/audio/speech에서 제공되지 않습니다 — 대신 Gemini 네이티브 인터페이스로 호출하세요:

curl "https://api.orcarouter.ai/v1beta/models/google/gemini-2.5-flash-preview-tts:generateContent" \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello, world!"}]}],
    "generationConfig": {
      "responseModalities": ["AUDIO"],
      "speechConfig": {
        "voiceConfig": {"prebuiltVoiceConfig": {"voiceName": "Kore"}}
      }
    }
  }'

오디오 바이트는 응답의 inlineData 필드 내에 base64로 반환됩니다. 사용 가능한 음성 이름과 구성 옵션의 전체 세트는 Google의 Gemini TTS 문서를 참조하세요.

​OpenAI 형태: /v1/audio/speech

​Gemini TTS: 네이티브 /v1beta/

​관련 항목

OpenAI 형태: `/v1/audio/speech`

Gemini TTS: 네이티브 `/v1beta/`

관련 항목