Zum Hauptinhalt springen
POST
/
video
/
generations
Eine Video-Aufgabe einreichen
curl --request POST \
  --url https://api.orcarouter.ai/v1/video/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "kling/kling-v3-omni",
  "prompt": "<string>",
  "image": "<string>",
  "metadata": {}
}
'
{
  "id": "<string>",
  "task_id": "<string>",
  "model": "<string>",
  "progress": 50,
  "created_at": 123
}

Autorisierungen

Authorization
string
header
erforderlich

OrcaRouter-API-Schlüssel sehen aus wie sk-orca-.... Übergib sie im Authorization: Bearer sk-orca-...-Header.

Body

application/json

Wähle die Variante, die zu deinem model-Präfix passt:

  • kling/...Kling video request
  • byteplus/...Seedance video request
model
enum<string>
erforderlich

Kling-Video-Modell (kundenseitiger Name mit kling/-Namespace-Präfix). Der Endpunkt, den Kling tatsächlich bedient (text2video / image2video / omni-video), wird durch die übergebenen Metadatenfelder bestimmt, nicht durch den gewählten Modellnamen — aber nur kling/kling-video-o1 und kling/kling-v3-omni akzeptieren die Multi-Quellen-Referenzfelder (image_list / video_list).

Verfügbare Optionen:
kling/kling-v2-master,
kling/kling-v2-1-master,
kling/kling-v2-5-turbo,
kling/kling-v2-6,
kling/kling-v3,
kling/kling-video-o1,
kling/kling-v3-omni
Beispiel:

"kling/kling-v3-omni"

prompt
string
erforderlich

Erforderlich. Kling lehnt leere / nur-Whitespace-Prompts ab.

image
string

Optionales First-Frame-Bild für Bild-zu-Video (URL oder Base64-Data-URI). Gegenseitig informativ mit metadata.image_tail.

metadata
object

Von Kling honorierter Freiform-Parameter-Beutel.

Universal (alle Endpunkte):

  • mode (string): std (720P) / pro (1080P) / 4k. 4k nur auf kling/kling-v3 und kling/kling-v3-omni. Standard ist std für Text-/Bild-zu-Video, pro für Omni-Video.
  • aspect_ratio (string): 16:9 / 9:16 / 1:1.
  • duration (string): Länge in Sekunden, Standard "5". kling/kling-v3-omni und kling/kling-v3 akzeptieren "3"-"15"; v2-Familie und kling/kling-video-o1 akzeptieren "5" oder "10".

Text-zu-Video und Bild-zu-Video nur (NICHT Omni-Video):

  • negative_prompt (string): Dinge zu vermeiden. Max 2500 Zeichen.
  • cfg_scale (number): Bereich [0, 1], Standard 0.5. Höher = strengere Prompt-Treue. Nicht unterstützt auf v2.x-Modellen.
  • image_tail (string): Last-Frame-Bild für First-/Last-Frame-Bild-zu-Video.

Multi-Quellen-Referenz (Omni-Endpunkt, nur kling/kling-video-o1 / kling/kling-v3-omni):

  • image_list (array): [{image_url, type}] — Multi-Bild-Referenz. Referenziere Bilder im Prompt mit <<<image_1>>> usw.
  • video_list (array): [{video_url, refer_type, keep_original_sound}]. Auf kling/kling-v3-omni auf 3-10s und std/pro-Modus (nicht 4K) begrenzt.

Erweiterte Funktionen (modellabhängig — siehe Capability Map):

  • multi_shot (bool) + shot_type (customize / intelligence) + multi_prompt ([{index, prompt, duration}]): Multi-Shot-Modus. Verfügbar auf kling/kling-v3 und kling/kling-v3-omni.
  • sound (string): "on" / "off" — natives Audio. Verfügbar auf kling/kling-v3 und kling/kling-v3-omni (beliebiger Modus) und kling/kling-v2-6 (nur pro-Modus).
  • watermark_info (object): {enabled: bool}. Universal.

Antwort

200 - application/json

Aufgabe akzeptiert (asynchron — frage /v1/video/generations/{task_id} ab)

OpenAI-stil-Einreichungsantwort. Zurückgegeben von POST /v1/video/generations (und dem OpenAI-symmetrischen Alias POST /v1/videos).

id
string

Aufgaben-ID. Gleicher Wert wie task_id (für Legacy-Clients beibehalten).

task_id
string
object
enum<string>
Verfügbare Optionen:
video
model
string

Modellname, wie ihn der Kunde gesendet hat (Alias / Namespace-Präfix erhalten, nicht der vom Upstream aufgelöste Name).

status
enum<string>

Immer queued bei erfolgreicher Einreichung.

Verfügbare Optionen:
queued
progress
integer
Erforderlicher Bereich: 0 <= x <= 100
created_at
integer

Unix-Zeitstempel, als die Aufgabe eingereicht wurde.