- Mô hình search-preview — gọi một biến thể tìm kiếm trực tiếp qua
/v1/chat/completions - Tools / options trên mô hình thông thường — truyền
web_search_options(Chat) hoặctools: [{"type": "web_search"}](Responses)
Mô hình search-preview (OpenAI)
OpenAI công bố các biến thể search-preview cho nhiều mô hình — ví dụopenai/gpt-4o-search-preview và openai/gpt-5-search-api. Chọn một
trong số đó làm model trên /v1/chat/completions và upstream sẽ xử
lý tìm kiếm phía máy chủ.
Gọi /v1/models để lấy danh mục trực tiếp.
web_search_options (Chat Completions)
search_context_size: low / medium / high. Kiểm soát độ sâu tìm
kiếm (giá theo lệnh gọi cho web_search giống nhau bất kể kích thước).
Tools (Responses API)
/v1/responses chấp nhận tools: [{"type": "web_search"}] cho cả mô
hình OpenAI và bất kỳ mô hình Grok nào — bề mặt Agent Tools của xAI
nằm tại cùng một endpoint.
web_search_call mà upstream phát ra đều được tính cho mục đích
tính phí — xem
Vận hành / Thanh toán và sử dụng.
Hỗ trợ giữa các nhà cung cấp
Tìm kiếm web có sẵn cho mọi nhà cung cấp cung cấp tính năng đó; chỉ khác nhau ở điểm vào:| Nhà cung cấp | Tìm kiếm web | Cách thức |
|---|---|---|
| OpenAI | ✅ | Các mô hình search-preview, hoặc truyền công cụ web_search vào /v1/responses |
| xAI Grok | ✅ | Gọi /v1/responses với tools: [{"type": "web_search"}] và bất kỳ mô hình Grok nào — Agent Tools API của xAI. (xAI đã ngừng hỗ trợ search_parameters cũ trên chat completions vào 2026-01-12; các biến thể *-search cũ trong tên mô hình không còn hoạt động.) |
| Anthropic | ✅ | Truyền web_search_options trên yêu cầu Chat Completions — được dịch thành công cụ server web_search bản địa của Anthropic. search_context_size (low/medium/high) ánh xạ tới max_uses; user_location.approximate ánh xạ tới user_location của Anthropic. |
| Gemini | ✅ | Truyền một công cụ hàm có tên googleSearch (xem bên dưới) — được dịch thành công cụ grounding GoogleSearch bản địa của Gemini. |
| DeepSeek | ❌ | API DeepSeek không cung cấp tìm kiếm web. |
Gemini grounding qua googleSearch
Với các mô hình Gemini, lớp dịch của OrcaRouter nhận diện một tên
hàm ma thuật googleSearch và biến nó thành công cụ grounding
GoogleSearch bản địa của Gemini. Gửi nó như bất kỳ công cụ hàm kiểu
OpenAI nào:
webSearchQueries, v.v.)
được gateway ghi nhận cho mục đích tính phí và đưa ra qua các trường
chat-completion tiêu chuẩn. Hai tên hàm ma thuật liên quan cũng được
nhận diện trên cùng đường này:
codeExecution— bật công cụ code-execution bản địa của GeminiurlContext— bật công cụ URL-context của Gemini
Hoặc dùng bản địa
Nếu bạn đã đang ở giao thức bản địa của Gemini qua/v1beta/, truyền
trực tiếp googleSearch theo định dạng Gemini — không cần dịch tên ma
thuật:
{"codeExecution": {}} và {"urlContext": {}} hoạt động tương tự
trên đường bản địa. Xem
Định dạng gốc / Gemini.
Tính phí
web_search và web_search_preview được theo dõi như các lệnh gọi
công cụ dựng sẵn. Chúng có mức giá khác nhau — xem
Vận hành / Thanh toán và sử dụng
để biết chi tiết.