跳转到主要内容
POST
/
audio
/
speech
生成语音
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

授权

Authorization
string
header
必填

OrcaRouter API 密钥形如 sk-orca-...。请在 Authorization: Bearer sk-orca-... 头中传入。

请求体

application/json
model
string
必填

OpenAI TTS 模型——openai/tts-1openai/tts-1-hdopenai/gpt-4o-mini-tts。Gemini TTS 预览模型不在此端点 服务;请改用 Gemini 原生 /v1beta/ 接口配合 responseModalities: ["AUDIO"]

示例:

"openai/tts-1"

input
string
必填
voice
string
必填

声音标识。网关原样转发此字段——请使用上游模型支持的声音 名称。

示例:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

可选的声音方向(如风格、语气)。被支持此特性的模型识别, 如 openai/gpt-4o-mini-tts

speed
number

播放速率。默认 1.0

必填范围: 0.25 <= x <= 4
stream_format
string

设置后,响应按此格式逐块流式返回(视上游支持情况)。

response_format
enum<string>
默认值:mp3
可用选项:
mp3,
opus,
aac,
flac,
wav,
pcm

响应

二进制音频内容。