Chuyển đến nội dung chính
Gửi hình ảnh dưới dạng một content part với type: "image_url". Truyền một URL https:// có thể truy cập công khai — đây là dạng được hỗ trợ rộng rãi nhất. URI nội tuyến data:image/...;base64,... hoạt động với các đích OpenAI và Gemini. Với mô hình Anthropic và xAI Grok, hãy ưu tiên host hình ảnh sau một URL https:// hoặc dùng định dạng HTTP bản địa của nhà cung cấp (xem Định dạng gốc) khi gửi base64.
resp = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "What's in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/cat.jpg"}},
        ],
    }],
)

Các họ mô hình có khả năng thị giác

Thị giác hoạt động với bất kỳ mô hình upstream nào chấp nhận đầu vào hình ảnh. Ví dụ:
  • Họ OpenAI gpt-4o*gpt-4.1*
  • Họ Anthropic Claude 4 (tất cả các mô hình hiện tại)
  • Đa phương thức Google Gemini (gemini-{2.5,3,3.1}-{flash,pro})
  • Họ xAI Grok 4 (thị giác được tích hợp sẵn trong các mô hình chat Grok 4 thông thường)

Giới hạn kích thước

Mỗi nhà cung cấp upstream áp dụng giới hạn kích thước hình ảnh riêng (thường ở mức một chữ số MB cho base64 nội tuyến và cao hơn cho URL được host). OrcaRouter tôn trọng giới hạn của upstream, nên việc vượt quá sẽ xuất hiện dưới dạng lỗi 400 từ nhà cung cấp. Hãy kiểm tra tài liệu thị giác hiện hành của upstream để biết con số chính xác.