الانتقال إلى المحتوى الرئيسي
POST
/
audio
/
speech
توليد الكلام
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

التفويضات

Authorization
string
header
مطلوب

تبدو مفاتيح OrcaRouter API على شكل sk-orca-.... مرّرها في ترويسة Authorization: Bearer sk-orca-....

الجسم

application/json
model
string
مطلوب

نموذج TTS من OpenAI — openai/tts-1 و openai/tts-1-hd و openai/gpt-4o-mini-tts. نماذج Gemini TTS التجريبية لا تُخدَّم على هذه النقطة؛ استخدم واجهة Gemini الأصلية /v1beta/ مع responseModalities: ["AUDIO"] بدلًا من ذلك.

مثال:

"openai/tts-1"

input
string
مطلوب
voice
string
مطلوب

معرّف الصوت. تمرّر البوابة هذا الحقل إلى المصدر الأصلي دون تعديل — استخدم أي اسم صوت يدعمه نموذج المصدر.

أمثلة:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

توجيه صوتي اختياري (مثل الأسلوب والنبرة). تكرّمه النماذج التي تدعمه، مثل openai/gpt-4o-mini-tts.

speed
number

معدل التشغيل. الافتراضي 1.0.

النطاق المطلوب: 0.25 <= x <= 4
stream_format
string

عند تعيينه، تُبثّ الاستجابة بهذا التنسيق جزءًا جزءًا (مع مراعاة دعم المصدر).

response_format
enum<string>
افتراضي:mp3
الخيارات المتاحة:
mp3,
opus,
aac,
flac,
wav,
pcm

الاستجابة

محتوى صوتي ثنائي.