Saltar al contenido principal
POST
/
audio
/
speech
Generar voz
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

Autorizaciones

Authorization
string
header
requerido

Las claves API de OrcaRouter se ven como sk-orca-.... Pásalas en la cabecera Authorization: Bearer sk-orca-....

Cuerpo

application/json
model
string
requerido

Modelo TTS de OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. Los modelos preview de Gemini TTS no se sirven en este endpoint; usa la superficie nativa /v1beta/ de Gemini con responseModalities: ["AUDIO"] en su lugar.

Ejemplo:

"openai/tts-1"

input
string
requerido
voice
string
requerido

Identificador de voz. La pasarela reenvía este campo al upstream sin cambios — usa cualquier nombre de voz que el modelo upstream soporte.

Ejemplos:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

Dirección de voz opcional (p. ej. estilo, tono). Honrada por modelos que la soportan, como openai/gpt-4o-mini-tts.

speed
number

Tasa de reproducción. Por defecto 1.0.

Rango requerido: 0.25 <= x <= 4
stream_format
string

Cuando se configura, la respuesta se transmite en este formato fragmento por fragmento (sujeto al soporte upstream).

response_format
enum<string>
predeterminado:mp3
Opciones disponibles:
mp3,
opus,
aac,
flac,
wav,
pcm

Respuesta

Contenido de audio binario.