Перейти к основному содержанию
POST
/
audio
/
speech
Сгенерировать речь
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

Авторизации

Authorization
string
header
обязательно

API-ключи OrcaRouter выглядят как sk-orca-.... Передавайте их в заголовке Authorization: Bearer sk-orca-....

Тело

application/json
model
string
обязательно

TTS-модель OpenAI — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. Превью TTS-моделей Gemini не обслуживаются на этом эндпоинте; используйте нативную поверхность Gemini /v1beta/ с responseModalities: ["AUDIO"].

Пример:

"openai/tts-1"

input
string
обязательно
voice
string
обязательно

Идентификатор голоса. Шлюз пересылает это поле провайдеру без изменений — используйте имя голоса, которое поддерживается моделью провайдера.

Примеры:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

Опциональное указание голосу (например, стиль, тон). Поддерживается моделями, которые это умеют, такими как openai/gpt-4o-mini-tts.

speed
number

Скорость воспроизведения. По умолчанию 1.0.

Требуемый диапазон: 0.25 <= x <= 4
stream_format
string

Когда задано, ответ передаётся потоком в этом формате фрагмент за фрагментом (при условии поддержки провайдером).

response_format
enum<string>
по умолчанию:mp3
Доступные опции:
mp3,
opus,
aac,
flac,
wav,
pcm

Ответ

Бинарное аудиосодержимое.