Vai al contenuto principale
POST
/
audio
/
speech
Genera audio vocale
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

Autorizzazioni

Authorization
string
header
obbligatorio

Le chiavi API di OrcaRouter hanno la forma sk-orca-.... Passale nell'header Authorization: Bearer sk-orca-....

Corpo

application/json
model
string
obbligatorio

Modello TTS di OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. I modelli preview Gemini TTS non sono serviti su questo endpoint; usa invece la superficie nativa /v1beta/ di Gemini con responseModalities: ["AUDIO"].

Esempio:

"openai/tts-1"

input
string
obbligatorio
voice
string
obbligatorio

Identificatore della voce. Il gateway inoltra questo campo all'upstream invariato — usa qualsiasi nome di voce supportato dal modello upstream.

Esempi:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

Direzione vocale opzionale (es. stile, tono). Onorato dai modelli che lo supportano, come openai/gpt-4o-mini-tts.

speed
number

Velocità di riproduzione. Default 1.0.

Intervallo richiesto: 0.25 <= x <= 4
stream_format
string

Quando impostato, la risposta viene trasmessa in questo formato chunk-by-chunk (soggetto al supporto dell'upstream).

response_format
enum<string>
predefinito:mp3
Opzioni disponibili:
mp3,
opus,
aac,
flac,
wav,
pcm

Risposta

Contenuto audio binario.