شكل OpenAI: /v1/audio/speech
استخدم هذه النقطة مع عائلة نماذج TTS من OpenAI — openai/tts-1،
openai/tts-1-hd، openai/gpt-4o-mini-tts، وما شابه:
Content-Type تخبرك بالصيغة التي أعادها المزوّد (audio/mpeg، audio/wav،
audio/opus، أو audio/flac).
Gemini TTS: واجهة /v1beta/ الأصلية
نماذج Gemini TTS التجريبية (مثل google/gemini-2.5-flash-preview-tts) لا تُقدَّم عبر /v1/audio/speech — استدعِها عبر واجهة Gemini الأصلية بدلاً من ذلك:
inlineData في الاستجابة. راجع وثائق Gemini TTS من Google للحصول على المجموعة الكاملة من أسماء الأصوات وخيارات الإعداد.
انظر أيضًا
- مرجع API / الصوت — المخطط الكامل مع التجربة التفاعلية
- الصيغ الأصلية / Gemini
- متقدّم / إدخال الصوت — إرسال الصوت إلى نموذج المحادثة
