Passer au contenu principal
POST
/
audio
/
speech
Générer de la parole
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

Autorisations

Authorization
string
header
requis

Les clés API OrcaRouter ressemblent à sk-orca-.... Passez-les dans l'en-tête Authorization: Bearer sk-orca-....

Corps

application/json
model
string
requis

Modèle TTS OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. Les modèles preview Gemini TTS ne sont pas servis sur cet endpoint ; utilisez la surface native /v1beta/ de Gemini avec responseModalities: ["AUDIO"] à la place.

Exemple:

"openai/tts-1"

input
string
requis
voice
string
requis

Identifiant de voix. La passerelle transmet ce champ à l'amont inchangé — utilisez quel que soit le nom de voix que le modèle amont prend en charge.

Exemples:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

Direction de voix optionnelle (par ex. style, ton). Honorée par les modèles qui la prennent en charge, comme openai/gpt-4o-mini-tts.

speed
number

Taux de lecture. Défaut 1.0.

Plage requise: 0.25 <= x <= 4
stream_format
string

Quand défini, la réponse est streamée dans ce format morceau par morceau (sous réserve du support amont).

response_format
enum<string>
défaut:mp3
Options disponibles:
mp3,
opus,
aac,
flac,
wav,
pcm

Réponse

Contenu audio binaire.