Générer de la parole

curl --request POST \ --url https://api.orcarouter.ai/v1/audio/speech \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "openai/tts-1", "input": "<string>", "voice": "<string>", "instructions": "<string>", "speed": 2.125, "stream_format": "<string>", "response_format": "mp3" } '

Autorisations

Authorization

string

header

requis

Les clés API OrcaRouter ressemblent à sk-orca-.... Passez-les dans l'en-tête Authorization: Bearer sk-orca-....

Corps

application/json

model

string

requis

Modèle TTS OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. Les modèles preview Gemini TTS ne sont pas servis sur cet endpoint ; utilisez la surface native /v1beta/ de Gemini avec responseModalities: ["AUDIO"] à la place.

Exemple:

"openai/tts-1"

input

string

requis

voice

string

requis

Identifiant de voix. La passerelle transmet ce champ à l'amont inchangé — utilisez quel que soit le nom de voix que le modèle amont prend en charge.

Exemples:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions

string

Direction de voix optionnelle (par ex. style, ton). Honorée par les modèles qui la prennent en charge, comme openai/gpt-4o-mini-tts.

speed

number

Taux de lecture. Défaut 1.0.

Plage requise: 0.25 <= x <= 4

stream_format

string

Quand défini, la réponse est streamée dans ce format morceau par morceau (sous réserve du support amont).

response_format

enum<string>

défaut:mp3

Options disponibles:

mp3,

opus,

aac,

flac,

wav,

pcm

Réponse

Contenu audio binaire.