Przejdź do głównej treści
POST
/
video
/
generations
Wyślij zadanie wideo
curl --request POST \
  --url https://api.orcarouter.ai/v1/video/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "kling/kling-v3-omni",
  "prompt": "<string>",
  "image": "<string>",
  "metadata": {}
}
'
{
  "id": "<string>",
  "task_id": "<string>",
  "model": "<string>",
  "progress": 50,
  "created_at": 123
}

Autoryzacje

Authorization
string
header
wymagane

Klucze API OrcaRouter wyglądają jak sk-orca-.... Przekaż je w nagłówku Authorization: Bearer sk-orca-....

Treść

application/json

Wybierz wariant pasujący do Twojego prefiksu model:

  • kling/...Kling video request
  • byteplus/...Seedance video request
model
enum<string>
wymagane

Model wideo Kling (nazwa po stronie klienta z prefiksem namespace kling/). Endpoint, który Kling faktycznie obsługuje (text2video / image2video / omni-video) jest określony przez pola metadanych, które przekazujesz, a nie przez to, którą nazwę modelu wybierzesz — ale tylko kling/kling-video-o1 i kling/kling-v3-omni akceptują pola referencji multi-source (image_list / video_list).

Dostępne opcje:
kling/kling-v2-master,
kling/kling-v2-1-master,
kling/kling-v2-5-turbo,
kling/kling-v2-6,
kling/kling-v3,
kling/kling-video-o1,
kling/kling-v3-omni
Przykład:

"kling/kling-v3-omni"

prompt
string
wymagane

Wymagane. Kling odrzuca puste prompty / złożone tylko z białych znaków.

image
string

Opcjonalny obraz pierwszej klatki dla image-to-video (URL lub URI data base64). Wzajemnie informatywne z metadata.image_tail.

metadata
object

Wolnoformatowy worek parametrów honorowanych przez Kling.

Uniwersalne (wszystkie endpointy):

  • mode (string): std (720P) / pro (1080P) / 4k. 4k tylko na kling/kling-v3 i kling/kling-v3-omni. Domyślnie std dla text/image-to-video, pro dla Omni-Video.
  • aspect_ratio (string): 16:9 / 9:16 / 1:1.
  • duration (string): Długość w sekundach, domyślnie "5". kling/kling-v3-omni i kling/kling-v3 akceptują "3"-"15"; rodzina v2 oraz kling/kling-video-o1 akceptują "5" lub "10".

Tylko text-to-video i image-to-video (NIE Omni-Video):

  • negative_prompt (string): Rzeczy do uniknięcia. Max 2500 znaków.
  • cfg_scale (number): Zakres [0, 1], domyślnie 0.5. Wyższy = ściślejsza zgodność z promptem. Nieobsługiwane na modelach v2.x.
  • image_tail (string): Obraz ostatniej klatki dla first/last-frame image-to-video.

Referencja multi-source (endpoint Omni, tylko kling/kling-video-o1 / kling/kling-v3-omni):

  • image_list (array): [{image_url, type}] — referencja wieloobrazowa. Odwołuj się do obrazów w promptcie przez <<<image_1>>> itd.
  • video_list (array): [{video_url, refer_type, keep_original_sound}]. Na kling/kling-v3-omni ograniczone do 3-10s i trybu std/pro (nie 4K).

Zaawansowane funkcje (zależne od modelu — zobacz Capability Map):

  • multi_shot (bool) + shot_type (customize / intelligence)
    • multi_prompt ([{index, prompt, duration}]): tryb multi-shot. Dostępne na kling/kling-v3 i kling/kling-v3-omni.
  • sound (string): "on" / "off" — natywne audio. Dostępne na kling/kling-v3 i kling/kling-v3-omni (dowolny tryb) oraz kling/kling-v2-6 (tylko tryb pro).
  • watermark_info (object): {enabled: bool}. Uniwersalne.

Odpowiedź

200 - application/json

Zadanie przyjęte (async — pollluj /v1/video/generations/{task_id})

Odpowiedź submit w stylu OpenAI. Zwracana przez POST /v1/video/generations (oraz symetryczny alias OpenAI POST /v1/videos).

id
string

Task ID. Ta sama wartość co task_id (zachowana dla starszych klientów).

task_id
string
object
enum<string>
Dostępne opcje:
video
model
string

Nazwa modelu w postaci, w jakiej klient ją wysłał (alias / prefiks namespace zachowany, nie nazwa rozwinięta przez upstream).

status
enum<string>

Zawsze queued przy pomyślnym zgłoszeniu.

Dostępne opcje:
queued
progress
integer
Wymagany zakres: 0 <= x <= 100
created_at
integer

Znacznik czasu Unix, kiedy zadanie zostało zgłoszone.