跳轉到主要內容
POST
/
audio
/
speech
生成語音
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

授權

Authorization
string
header
必填

OrcaRouter API 密鑰形如 sk-orca-...。請在 Authorization: Bearer sk-orca-... 頭中傳入。

主體

application/json
model
string
必填

OpenAI TTS 模型——openai/tts-1openai/tts-1-hdopenai/gpt-4o-mini-tts。Gemini TTS 預覽模型不在此端點 服務;請改用 Gemini 原生 /v1beta/ 接口配合 responseModalities: ["AUDIO"]

範例:

"openai/tts-1"

input
string
必填
voice
string
必填

聲音標識。網關原樣轉發此字段——請使用上游模型支持的聲音 名稱。

範例:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

可選的聲音方向(如風格、語氣)。被支持此特性的模型識別, 如 openai/gpt-4o-mini-tts

speed
number

播放速率。默認 1.0

必填範圍: 0.25 <= x <= 4
stream_format
string

設置后,響應按此格式逐塊流式返回(視上游支持情況)。

response_format
enum<string>
預設值:mp3
可用選項:
mp3,
opus,
aac,
flac,
wav,
pcm

回應

二進制音頻內容。