跳轉到主要內容
OrcaRouter 通過兩條路徑暴露圖像生成,取決于你挑選的模型:
  1. /v1/images/generations —— OpenAI 圖像 API 形態。最適合 專用圖像生成模型(DALL-E 替代家族、Imagen、Grok Imagine)。
  2. /v1/chat/completions —— 對話式圖像生成。最適合那種一輪內 既返回文字又返回圖像的模型(Gemini 的 nano-banana / “imagine” 系列)。

路徑 1:專用圖像 API

/v1/images/generations 遵循 OpenAI 圖像 API 形態。可用于該端點的 模型家族:
  • OpenAI:openai/gpt-image-1openai/gpt-image-1-miniopenai/gpt-image-1.5
  • Google Imagen:google/imagen-4.0-fast-generate-001google/imagen-4.0-generate-001google/imagen-4.0-ultra-generate-001
  • xAI:grok/grok-imagine-imagegrok/grok-imagine-image-pro
curl https://api.orcarouter.ai/v1/images/generations \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-image-1",
    "prompt": "A cat astronaut on Mars, photorealistic",
    "size": "1024x1024"
  }'

路徑 2:通過 chat completions 生成圖像

某些 Gemini 模型可以把圖像作為一次普通 chat 對話的一部分返回。 當你選中這些模型時,OrcaRouter 會自動告訴上游同時返回文字與圖像:
  • google/gemini-2.5-flash-image
  • google/gemini-3-pro-image-preview
  • google/gemini-3.1-flash-image-preview

示例

from openai import OpenAI

client = OpenAI(base_url="https://api.orcarouter.ai/v1", api_key="sk-orca-...")

resp = client.chat.completions.create(
    model="google/gemini-2.5-flash-image",
    messages=[{"role": "user", "content": "Draw a watercolour of a foggy harbor at dawn."}],
)

# resp.choices[0].message.content 會包含文字 + 圖像 data URL 或
# inline_data 塊,具體形態取決于 SDK 的序列化方式。如果你的 SDK
# 不直接透出圖像,請檢查原始響應。
這些模型不能通過 /v1/images/generations 調用——它們必須走 chat completions。

另見