gpt-4o-mini sang mô hình đắt nhất mà bạn có quyền truy cập,
hoặc sang một mô hình mà cách xử lý dữ liệu của nó bạn chưa bao giờ phê
duyệt.
Cách khắc phục là một danh sách mô hình cho phép theo từng key. Mỗi key
mang theo một trường model_limits (được kiểm soát bởi
model_limits_enabled). Khi nó bật, một request cho bất kỳ mô hình nào
không có trên danh sách bị từ chối ở gateway — trước khi một channel
được chọn và trước khi bất cứ thứ gì rời đi cho một provider.
Đây là một ràng buộc trên đối tượng key.
Nó kết hợp với danh sách IP cho phép, mức trần chi tiêu, mốc hết hạn, và
chính sách guardrail / firewall đã gắn của key — mỗi cái thu hẹp key một
cách độc lập.
1. Tại sao giới hạn quyền truy cập mô hình theo từng API key
Lựa chọn mô hình là một đòn bẩy agency. Một key có thể gọi bất kỳ mô hình nào có thể bị lái vào:- Bùng nổ chi phí — chuyển sang một mô hình cao cấp nhân hóa đơn lên theo từng token.
- Trồi sụt năng lực — một tác vụ được định phạm vi cho một mô hình nhỏ bị định tuyến sang một mô hình frontier có thể làm nhiều hơn nhiều so với ý định của bạn.
- Trôi dạt tuân thủ — gửi traffic tới một họ mô hình mà bạn chưa thông qua cho một lớp dữ liệu nhất định.
2. Hai trường
Giới hạn mô hình nằm trên key thành một cặp:| Trường | Kiểu | Ý nghĩa |
|---|---|---|
model_limits_enabled | bool | Công tắc chủ. Khi false, key vươn tới mọi mô hình mà workspace cho phép. |
model_limits | list | Danh sách tên mô hình cho phép. Chỉ có ý nghĩa khi model_limits_enabled là true. |
3. Đặt nó trên một key
Cấu hình giới hạn mô hình trong trình chỉnh sửa key ở console (/console/token), cùng nơi bạn đặt các ràng buộc khác của key. Tạo hoặc
chỉnh sửa một key yêu cầu vai trò Developer trở lên.
- Mở key (hoặc Create key).
- Bật Model limits.
- Chọn các mô hình mà key này có thể gọi — gõ để lọc các mô hình khả dụng của workspace.
- Lưu. Thay đổi có hiệu lực ở request kế tiếp của key — không triển khai lại, không xoay vòng key.
gpt-4o-mini. Bất kỳ tên mô hình nào khác trên
một request từ key này đều bị từ chối — không có fallback về một mô hình mặc
định và không có hạ cấp âm thầm.
4. Một request bị từ chối trông như thế nào
Khimodel_limits_enabled bật và một request nêu tên một mô hình ngoài
danh sách, gateway hủy request với HTTP 403 và một thân lỗi định dạng
OpenAI:
Nó xảy ra trước khi chọn provider
Nó xảy ra trước khi chọn provider
Việc kiểm tra chạy trong khi gateway vẫn đang chọn một channel —
request không bao giờ đến một provider thượng nguồn, nên một mô hình bị
cấm không tốn token mô hình nào.
Danh sách rỗng = không mô hình nào
Danh sách rỗng = không mô hình nào
Với công tắc bật và một danh sách cho phép rỗng, thông báo là “This
token has no access to any models” và mọi request bị từ chối. Đây
là sự khác biệt giữa “giới hạn vào một danh sách” và “khóa key ra khỏi
inference hoàn toàn.”
So khớp dựa trên tên mô hình chuẩn hóa
So khớp dựa trên tên mô hình chuẩn hóa
Tên mô hình của request được chuẩn hóa trước khi danh sách được kiểm
tra, nên các biến thể liên quan (vd: các biến thể thinking) phân giải về
cùng tên chuẩn mà bạn đã allow-list. Liệt kê tên mô hình cơ sở mà
console hiển thị cho bạn.
5. Giới hạn mô hình vs. quyền của group
Hai thứ khác nhau quyết định liệu một key có thể gọi một mô hình hay không. Đừng nhầm chúng:| Lớp | Phạm vi | Câu hỏi nó trả lời |
|---|---|---|
| Quyền workspace | Workspace | Mô hình này có khả dụng cho workspace ở mức nào không? |
model_limits | Một key | Trong các mô hình khả dụng, key NÀY có thể dùng cái nào? |
model_limits chỉ bao giờ thu hẹp. Một key không thể dùng giới hạn mô
hình để vươn tới một mô hình mà bản thân workspace không có quyền — nó chỉ
có thể khoét ra một danh sách cho phép nhỏ hơn từ những gì đã được phép. Để
cấp cho một key không gì thêm mà ít hơn hẳn, đó chính xác là điều
trường này dùng để làm.
6. Vị trí của nó trong tư thế least-agency
Giới hạn mô hình là một dòng của công thức key theo từng agent. Key hữu ích hẹp nhất cho một agent tự chủ ghim tất cả các trục của nó cùng lúc:model_limits— một hoặc hai mô hình mà agent cần (trang này).allow_ips— dải egress của agent, xem Danh sách IP cho phép.credit_limit_usd— một mức trần chi tiêu, xem Quota, mức trần & hết hạn.expired_time— một mốc hết hạn tự động, xem Key hết hạn.guardrail_id/firewall_policy_id— chính sách nội dung và cuộc gọi tool, xem Gắn chính sách vào một key.
Giới hạn mô hình là một ràng buộc danh tính trên key, không phải một
chính sách nội dung hay hành động. Chúng không kiểm tra prompt (đó là
Guardrails) hay cuộc gọi tool (đó là
Firewall) — chúng quyết định, ngay từ đầu, mô hình
nào mà key thậm chí được phép gửi đến.
7. Bước tiếp theo
Đối tượng key
Mọi trường mà một key mang theo — giới hạn mô hình, danh sách IP, mức
trần, hết hạn, và phần đính kèm chính sách — trong một tham chiếu.
Checklist least-agency
Toàn bộ công thức key theo từng agent: định phạm vi mọi trục về mức tối
thiểu mà agent cần.
Phạm vi, key & chính sách
Cách key, guardrails, và chính sách firewall gắn kết với nhau thành một
danh tính agent.
Gắn chính sách vào một key
Gắn một guardrail và một chính sách firewall vào cùng một key.
