Text-to-speech - OrcaRouter

OrcaRouter espone due percorsi per il text-to-speech a seconda del modello TTS del provider che vuoi usare.

Forma OpenAI: `/v1/audio/speech`

Usa questo con la famiglia di modelli TTS di OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts e simili:

curl https://api.orcarouter.ai/v1/audio/speech \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello, world!",
    "voice": "alloy"
  }' \
  --output speech.mp3

La risposta è audio binario. L’header Content-Type indica quale formato l’upstream ha restituito (audio/mpeg, audio/wav, audio/opus o audio/flac).

Gemini TTS: `/v1beta/` nativo

I modelli TTS in anteprima di Gemini (es. google/gemini-2.5-flash-preview-tts) non sono serviti su /v1/audio/speech — chiamali invece tramite la superficie nativa di Gemini:

curl "https://api.orcarouter.ai/v1beta/models/google/gemini-2.5-flash-preview-tts:generateContent" \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello, world!"}]}],
    "generationConfig": {
      "responseModalities": ["AUDIO"],
      "speechConfig": {
        "voiceConfig": {"prebuiltVoiceConfig": {"voiceName": "Kore"}}
      }
    }
  }'

I byte audio tornano come base64 all’interno del campo inlineData della risposta. Vedi la documentazione di Gemini TTS di Google per l’insieme completo di nomi di voce e opzioni di configurazione.

Vedi anche

Riferimento API / Audio — schema completo con try-it
Formati nativi / Gemini
Avanzato / Input audio — invio di audio A un modello di chat

Immagini Prompts

​Forma OpenAI: /v1/audio/speech

​Gemini TTS: /v1beta/ nativo

​Vedi anche

Forma OpenAI: `/v1/audio/speech`

Gemini TTS: `/v1beta/` nativo

Vedi anche