توليد الكلام

curl --request POST \ --url https://api.orcarouter.ai/v1/audio/speech \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "openai/tts-1", "input": "<string>", "voice": "<string>", "instructions": "<string>", "speed": 2.125, "stream_format": "<string>", "response_format": "mp3" } '

التفويضات

Authorization

string

header

مطلوب

تبدو مفاتيح OrcaRouter API على شكل sk-orca-.... مرّرها في ترويسة Authorization: Bearer sk-orca-....

الجسم

application/json

model

string

مطلوب

نموذج TTS من OpenAI — openai/tts-1 و openai/tts-1-hd و openai/gpt-4o-mini-tts. نماذج Gemini TTS التجريبية لا تُخدَّم على هذه النقطة؛ استخدم واجهة Gemini الأصلية /v1beta/ مع responseModalities: ["AUDIO"] بدلًا من ذلك.

مثال:

"openai/tts-1"

input

string

مطلوب

voice

string

مطلوب

معرّف الصوت. تمرّر البوابة هذا الحقل إلى المصدر الأصلي دون تعديل — استخدم أي اسم صوت يدعمه نموذج المصدر.

أمثلة:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions

string

توجيه صوتي اختياري (مثل الأسلوب والنبرة). تكرّمه النماذج التي تدعمه، مثل openai/gpt-4o-mini-tts.

speed

number

معدل التشغيل. الافتراضي 1.0.

النطاق المطلوب: 0.25 <= x <= 4

stream_format

string

عند تعيينه، تُبثّ الاستجابة بهذا التنسيق جزءًا جزءًا (مع مراعاة دعم المصدر).

response_format

enum<string>

افتراضي:mp3

الخيارات المتاحة:

mp3,

opus,

aac,

flac,

wav,

pcm

الاستجابة

محتوى صوتي ثنائي.