Zum Hauptinhalt springen
Sende ein Bild als Inhaltsteil mit type: "image_url". Übergib eine öffentlich erreichbare https://-URL — das ist die universellste unterstützte Form. data:image/...;base64,...-Inline-URIs funktionieren für OpenAI- und Gemini-Ziele. Für Anthropic- und xAI-Grok-Modelle hoste das Bild lieber hinter einer https://-URL oder verwende die native HTTP-Form des Anbieters (siehe Native Formate), wenn du Base64 sendest.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Vision-fähige Modellfamilien

Vision funktioniert gegen jedes Upstream-Modell, das Bildeingabe akzeptiert. Beispiele:
  • OpenAI-gpt-4o*- und gpt-4.1*-Familie
  • Anthropic-Claude-4-Familie (alle aktuellen Modelle)
  • Google-Gemini-Multimodal (gemini-{2.5,3,3.1}-{flash,pro})
  • xAI-Grok-4-Familie (Vision ist in allgemeine Grok-4-Chat-Modelle eingebaut)

Größenlimits

Jeder Upstream-Anbieter erzwingt sein eigenes Größenlimit pro Bild (typischerweise im einstelligen MB-Bereich für inline Base64 und höher für gehostete URLs). OrcaRouter respektiert das Upstream-Limit, sodass das Überschreiten als 400 vom Anbieter erscheint. Prüfe die aktuelle Vision-Dokumentation des Upstreams für die exakte Zahl.