orcarouter/auto là một bộ định tuyến có tên
mà chúng tôi tạo cho mọi tài khoản khi đăng ký. Nó định tuyến mỗi yêu
cầu đến mô hình chat đang hoạt động rẻ nhất mà tài khoản của bạn có
quyền truy cập, được chọn mới cho mỗi yêu cầu.
Cách dùng
Hành vi mặc định
Cấu hình seed:- Mẫu: trống — khớp mọi mô hình chat mà tài khoản của bạn có quyền truy cập. Các mô hình mới khi lên kệ sẽ tự động trở thành ứng viên.
- Chiến lược:
cheapest— chọn mô hình có giá theo token thấp nhất trong số các ứng viên đang hoạt động. - Mô hình mặc định: không có. Nếu mẫu không giải ra được mô hình khả dụng nào, yêu cầu thất bại với lỗi rõ ràng. Bạn có thể đặt mặc định trong bảng điều khiển nếu muốn có lưới an toàn.
openai/*), đổi
chiến lược, đặt default_model, hoặc xóa router hoàn toàn — giống
như bất kỳ bộ định tuyến có tên nào.
Đổi chiến lược
Bảng điều khiển đưa ra bốn thẻ chiến lược. Cheapest là mặc định seed ở trên; chọn cái khác để thay đổi cáchorcarouter/auto giải lựa
chọn:
| Thẻ | Enum backend | Tác dụng |
|---|---|---|
| Cheapest | cheapest | Giá theo token thấp nhất trong số các ứng viên đang hoạt động. Mặc định seed. |
| Quality | quality | Điểm chất lượng cao nhất trong số các ứng viên đang hoạt động, bất kể giá. |
| Balanced | balanced | Chọn một tùy chọn chi phí thấp vẫn đạt một ngưỡng chất lượng; dự phòng sang tùy chọn chất lượng cao nhất nếu không có gì đạt ngưỡng. Mặc định cho các router mới bạn tự tạo. |
| Adaptive | linucb / gated_adaptive | LinUCB contextual bandit theo từng router học từ lưu lượng thực của bạn để cân nhắc chất lượng, chi phí, độ trễ và độ tin cậy cho từng yêu cầu. Hai chế độ con (Standard / Gated) — xem Bộ định tuyến có tên. |
Khi nào nên dùng Auto Router hơn là tên mô hình rõ ràng
- Bạn không muốn ghim vào một mô hình cụ thể; bạn muốn mô hình chat đang hoạt động rẻ nhất ở mỗi yêu cầu.
- Bạn đang prototyping và không muốn quan tâm nhà cung cấp nào đang hoạt động.
- Bạn muốn định tuyến của OrcaRouter “tự chạy” mà không cần nghĩ ngợi.
Khi nào nên dùng tên mô hình rõ ràng
- Bạn cần đầu ra xác định — chọn các mô hình khác nhau ở các thời điểm khác nhau sẽ thay đổi phong cách và chất lượng sinh.
- Bạn đang dùng các tính năng riêng của một mô hình (ví dụ
cache_controlcủa Claude, hoặc tạo ảnh bản địa của một mô hình). - Bạn muốn chi phí mỗi yêu cầu dự đoán được.
Xem Auto Router đã chọn gì
Kiểm tra header phản hồiX-Orca-Resolved-Model. Xem
Header phản hồi.
