Saltar para o conteúdo principal
Envie uma imagem como uma parte de conteúdo com type: "image_url". Passe uma URL https:// publicamente acessível — esta é a forma mais universalmente suportada. URIs inline data:image/...;base64,... funcionam para alvos OpenAI e Gemini. Para modelos Anthropic e xAI Grok, prefira hospedar a imagem atrás de uma URL https:// ou use o formato HTTP nativo do provedor (veja Formatos nativos) quando enviar base64.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Famílias de modelos capazes de visão

A visão funciona contra qualquer modelo upstream que aceita entrada de imagem. Exemplos:
  • Famílias OpenAI gpt-4o* e gpt-4.1*
  • Família Anthropic Claude 4 (todos os modelos atuais)
  • Multimodais Google Gemini (gemini-{2.5,3,3.1}-{flash,pro})
  • Família xAI Grok 4 (visão é integrada nos modelos gerais de chat do Grok 4)

Limites de tamanho

Cada provedor upstream impõe seu próprio teto de tamanho por imagem (tipicamente na faixa de um dígito de MB para base64 inline e maior para URLs hospedadas). O OrcaRouter respeita o limite do upstream, então excedê-lo aparece como um 400 do provedor. Verifique a documentação atual de visão do upstream para o número exato.