Saltar al contenido principal
Envía una imagen como parte de contenido con type: "image_url". Pasa una URL https:// accesible públicamente — es la forma universalmente más soportada. Los URI inline data:image/...;base64,... funcionan para destinos OpenAI y Gemini. Para modelos Anthropic y xAI Grok, prefiere alojar la imagen detrás de una URL https:// o usa la forma HTTP nativa del proveedor (ver Formatos nativos) cuando envíes base64.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Familias de modelos capaces de visión

La visión funciona contra cualquier modelo upstream que acepte entrada de imagen. Ejemplos:
  • Familias OpenAI gpt-4o* y gpt-4.1*
  • Familia Anthropic Claude 4 (todos los modelos actuales)
  • Multimodal Google Gemini (gemini-{2.5,3,3.1}-{flash,pro})
  • Familia xAI Grok 4 (la visión está integrada en los modelos generales de chat Grok 4)

Límites de tamaño

Cada proveedor upstream impone su propio tope de tamaño por imagen (generalmente en el rango de un dígito de MB para base64 inline y mayor para URL alojadas). OrcaRouter respeta el límite del upstream, así que excederlo aparece como un 400 del proveedor. Consulta la documentación actual de visión del upstream para el número exacto.