Przejdź do głównej treści
Wyślij obraz jako część treści z type: "image_url". Przekaż publicznie dostępny URL https:// — to najbardziej uniwersalnie obsługiwana forma. Inline URI data:image/...;base64,... działa dla celów OpenAI i Gemini. Dla modeli Anthropic i xAI Grok wolisz hostować obraz pod URL-em https:// lub użyć natywnego kształtu HTTP dostawcy (zobacz Formaty natywne) przy wysyłaniu base64.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Rodziny modeli z vision

Vision działa przeciwko każdemu upstreamowemu modelowi akceptującemu wejście obrazu. Przykłady:
  • Rodzina OpenAI gpt-4o* i gpt-4.1*
  • Rodzina Anthropic Claude 4 (wszystkie aktualne modele)
  • Multimodalny Google Gemini (gemini-{2.5,3,3.1}-{flash,pro})
  • Rodzina xAI Grok 4 (vision jest wbudowany w ogólne modele chat Grok 4)

Limity rozmiaru

Każdy upstreamowy dostawca egzekwuje własny limit rozmiaru per-obraz (zwykle w zakresie jednocyfrowych MB dla inline base64 i wyższy dla hostowanych URL-i). OrcaRouter respektuje limit upstreamu, więc przekroczenie pojawia się jako 400 od dostawcy. Sprawdź aktualną dokumentację vision upstreamu, aby poznać dokładną liczbę.