تحويل النص إلى كلام

يكشف OrcaRouter عن مسارين لتحويل النص إلى كلام بحسب نموذج TTS الخاص بالمزوّد الذي تريد استخدامه.

شكل OpenAI: `/v1/audio/speech`

استخدم هذه النقطة مع عائلة نماذج TTS من OpenAI — openai/tts-1، openai/tts-1-hd، openai/gpt-4o-mini-tts، وما شابه:

curl https://api.orcarouter.ai/v1/audio/speech \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/tts-1",
    "input": "Hello, world!",
    "voice": "alloy"
  }' \
  --output speech.mp3

الاستجابة عبارة عن صوت ثنائي. ترويسة Content-Type تخبرك بالصيغة التي أعادها المزوّد (audio/mpeg، audio/wav، audio/opus، أو audio/flac).

Gemini TTS: واجهة `/v1beta/` الأصلية

نماذج Gemini TTS التجريبية (مثل google/gemini-2.5-flash-preview-tts) لا تُقدَّم عبر /v1/audio/speech — استدعِها عبر واجهة Gemini الأصلية بدلاً من ذلك:

curl "https://api.orcarouter.ai/v1beta/models/google/gemini-2.5-flash-preview-tts:generateContent" \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello, world!"}]}],
    "generationConfig": {
      "responseModalities": ["AUDIO"],
      "speechConfig": {
        "voiceConfig": {"prebuiltVoiceConfig": {"voiceName": "Kore"}}
      }
    }
  }'

تعود بايتات الصوت مرمّزة بـ base64 داخل حقل inlineData في الاستجابة. راجع وثائق Gemini TTS من Google للحصول على المجموعة الكاملة من أسماء الأصوات وخيارات الإعداد.

انظر أيضًا

مرجع API / الصوت — المخطط الكامل مع التجربة التفاعلية
الصيغ الأصلية / Gemini
متقدّم / إدخال الصوت — إرسال الصوت إلى نموذج المحادثة

الصور المطالبات

​شكل OpenAI: /v1/audio/speech

​Gemini TTS: واجهة /v1beta/ الأصلية

​انظر أيضًا

شكل OpenAI: `/v1/audio/speech`

Gemini TTS: واجهة `/v1beta/` الأصلية

انظر أيضًا