Zum Hauptinhalt springen
POST
/
audio
/
speech
Sprache generieren
curl --request POST \
  --url https://api.orcarouter.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "openai/tts-1",
  "input": "<string>",
  "voice": "<string>",
  "instructions": "<string>",
  "speed": 2.125,
  "stream_format": "<string>",
  "response_format": "mp3"
}
'

Autorisierungen

Authorization
string
header
erforderlich

OrcaRouter-API-Schlüssel sehen aus wie sk-orca-.... Übergib sie im Authorization: Bearer sk-orca-...-Header.

Body

application/json
model
string
erforderlich

OpenAI-TTS-Modell — openai/tts-1, openai/tts-1-hd, openai/gpt-4o-mini-tts. Gemini-TTS-Preview-Modelle werden auf diesem Endpunkt nicht bedient; verwende stattdessen Geminis native /v1beta/-Oberfläche mit responseModalities: ["AUDIO"].

Beispiel:

"openai/tts-1"

input
string
erforderlich
voice
string
erforderlich

Stimm-Identifier. Das Gateway leitet dieses Feld unverändert an den Upstream weiter — verwende den Stimmnamen, den das Upstream-Modell unterstützt.

Beispiele:

"alloy"

"echo"

"fable"

"onyx"

"nova"

"shimmer"

instructions
string

Optionale Stimmrichtung (z. B. Stil, Ton). Honoriert von Modellen, die es unterstützen, wie openai/gpt-4o-mini-tts.

speed
number

Wiedergaberate. Standard 1.0.

Erforderlicher Bereich: 0.25 <= x <= 4
stream_format
string

Wenn gesetzt, wird die Antwort in diesem Format Chunk-für-Chunk gestreamt (vorbehaltlich Upstream-Unterstützung).

response_format
enum<string>
Standard:mp3
Verfügbare Optionen:
mp3,
opus,
aac,
flac,
wav,
pcm

Antwort

Binärer Audio-Inhalt.