Перейти к основному содержанию
Отправьте изображение как часть контента с type: "image_url". Передайте публично доступный https://-URL — это наиболее универсально поддерживаемая форма. Inline-URI data:image/...;base64,... работают для целей OpenAI и Gemini. Для моделей Anthropic и xAI Grok предпочтительнее размещать изображение по https://-URL или использовать нативный HTTP-формат провайдера (см. Нативные форматы) при отправке base64.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Семейства моделей с поддержкой зрения

Зрение работает с любой upstream-моделью, принимающей ввод изображений. Примеры:
  • Семейство OpenAI gpt-4o* и gpt-4.1*
  • Семейство Anthropic Claude 4 (все текущие модели)
  • Мультимодальные Google Gemini (gemini-{2.5,3,3.1}-{flash,pro})
  • Семейство xAI Grok 4 (зрение встроено в общие чат-модели Grok 4)

Ограничения по размеру

Каждый upstream-провайдер устанавливает свой лимит размера изображения (обычно в однозначном диапазоне мегабайт для inline base64 и выше для размещённых URL). OrcaRouter уважает лимит upstream, поэтому его превышение выливается в 400 от провайдера. Точные цифры смотрите в актуальной документации upstream по зрению.