メインコンテンツへスキップ
POST
/
audio
/
speech
音声を生成
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

承認

Authorization
string
header
必須

OrcaRouter API キーは sk-orca-... のような形式です。 Authorization: Bearer sk-orca-... ヘッダで渡してください。

ボディ

application/json
model
string
必須

OpenAI TTS モデル —— openai/tts-1openai/tts-1-hdopenai/gpt-4o-mini-tts。Gemini TTS プレビューモデルは このエンドポイントで提供されない; 代わりに Gemini の ネイティブ /v1beta/ インターフェースを responseModalities: ["AUDIO"] と一緒に使用。

:

"openai/tts-1"

input
string
必須
voice
string
必須

ボイス識別子。ゲートウェイはこのフィールドを変更なしで 上流に転送する —— 上流モデルがサポートする任意のボイス名 を使用してください。

:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

オプションのボイスディレクション (スタイル、トーン等)。 openai/gpt-4o-mini-tts のようなそれをサポートするモデル で尊重される。

speed
number

再生速度。既定 1.0

必須範囲: 0.25 <= x <= 4
stream_format
string

設定されたとき、レスポンスはこのフォーマットでチャンクごとに ストリーミングされる (上流サポートに依存)。

response_format
enum<string>
デフォルト:mp3
利用可能なオプション:
mp3,
opus,
aac,
flac,
wav,
pcm

レスポンス

バイナリ音声コンテンツ。