Chuyển đến nội dung chính
Một API key duy nhất có thể vươn tới mọi mô hình mà workspace của bạn có quyền. Điều đó tiện cho một session console và nguy hiểm cho một agent dài hạn: một agent bị prompt-inject giữ một key không hạn chế có thể lặng lẽ chuyển từ gpt-4o-mini sang mô hình đắt nhất mà bạn có quyền truy cập, hoặc sang một mô hình mà cách xử lý dữ liệu của nó bạn chưa bao giờ phê duyệt. Cách khắc phục là một danh sách mô hình cho phép theo từng key. Mỗi key mang theo một trường model_limits (được kiểm soát bởi model_limits_enabled). Khi nó bật, một request cho bất kỳ mô hình nào không có trên danh sách bị từ chối ở gateway — trước khi một channel được chọn và trước khi bất cứ thứ gì rời đi cho một provider.
Đây là một ràng buộc trên đối tượng key. Nó kết hợp với danh sách IP cho phép, mức trần chi tiêu, mốc hết hạn, và chính sách guardrail / firewall đã gắn của key — mỗi cái thu hẹp key một cách độc lập.

1. Tại sao giới hạn quyền truy cập mô hình theo từng API key

Lựa chọn mô hình là một đòn bẩy agency. Một key có thể gọi bất kỳ mô hình nào có thể bị lái vào:
  • Bùng nổ chi phí — chuyển sang một mô hình cao cấp nhân hóa đơn lên theo từng token.
  • Trồi sụt năng lực — một tác vụ được định phạm vi cho một mô hình nhỏ bị định tuyến sang một mô hình frontier có thể làm nhiều hơn nhiều so với ý định của bạn.
  • Trôi dạt tuân thủ — gửi traffic tới một họ mô hình mà bạn chưa thông qua cho một lớp dữ liệu nhất định.
Giới hạn một key vào một hoặc hai mô hình mà một agent thực sự cần đóng cả ba cùng lúc. Nó là tương đương trên trục mô hình của việc firewall allow-list các tool — agent chỉ có thể vươn tới những gì bạn nêu tên, và không gì khác.

2. Hai trường

Giới hạn mô hình nằm trên key thành một cặp:
TrườngKiểuÝ nghĩa
model_limits_enabledboolCông tắc chủ. Khi false, key vươn tới mọi mô hình mà workspace cho phép.
model_limitslistDanh sách tên mô hình cho phép. Chỉ có ý nghĩa khi model_limits_enabledtrue.
Hai trường độc lập, và sự kết hợp có ý nghĩa: model_limits_enabled = true với một danh sách rỗng nghĩa là key có thể vươn tới không mô hình nào — mọi request bị từ chối với “This token has no access to any models.” Chỉ bật công tắc một khi bạn đã nêu tên ít nhất một mô hình.

3. Đặt nó trên một key

Cấu hình giới hạn mô hình trong trình chỉnh sửa key ở console (/console/token), cùng nơi bạn đặt các ràng buộc khác của key. Tạo hoặc chỉnh sửa một key yêu cầu vai trò Developer trở lên.
  1. Mở key (hoặc Create key).
  2. Bật Model limits.
  3. Chọn các mô hình mà key này có thể gọi — gõ để lọc các mô hình khả dụng của workspace.
  4. Lưu. Thay đổi có hiệu lực ở request kế tiếp của key — không triển khai lại, không xoay vòng key.
Một summarizer theo lịch chỉ bao giờ nên động tới một mô hình rẻ kết thúc với một danh sách cho phép chính xác một mục:
model_limits_enabled: true
model_limits:         ["openai/gpt-4o-mini"]
Từ điểm đó key bị ghim vào gpt-4o-mini. Bất kỳ tên mô hình nào khác trên một request từ key này đều bị từ chối — không có fallback về một mô hình mặc định và không có hạ cấp âm thầm.
Ghép giới hạn mô hình với một mức trần credit_limit_usd trên cùng key. Danh sách mô hình ràng buộc mô hình nào một vòng lặp mất kiểm soát có thể vươn tới; mức trần chi tiêu ràng buộc bao nhiêu nó có thể đốt trước khi key ngừng hoạt động. Hai mức trần độc lập, cả hai đều được thực thi ở gateway. Xem Quota, mức trần & hết hạn.

4. Một request bị từ chối trông như thế nào

Khi model_limits_enabled bật và một request nêu tên một mô hình ngoài danh sách, gateway hủy request với HTTP 403 và một thân lỗi định dạng OpenAI:
{
  "error": {
    "message": "This token has no access to model claude-opus-4-8 (request id: 2024...abc)",
    "type": "orcarouter_api_error",
    "code": ""
  }
}
Các thuộc tính chính của việc từ chối:
Việc kiểm tra chạy trong khi gateway vẫn đang chọn một channel — request không bao giờ đến một provider thượng nguồn, nên một mô hình bị cấm không tốn token mô hình nào.
Với công tắc bật và một danh sách cho phép rỗng, thông báo là “This token has no access to any models”mọi request bị từ chối. Đây là sự khác biệt giữa “giới hạn vào một danh sách” và “khóa key ra khỏi inference hoàn toàn.”
Tên mô hình của request được chuẩn hóa trước khi danh sách được kiểm tra, nên các biến thể liên quan (vd: các biến thể thinking) phân giải về cùng tên chuẩn mà bạn đã allow-list. Liệt kê tên mô hình cơ sở mà console hiển thị cho bạn.

5. Giới hạn mô hình vs. quyền của group

Hai thứ khác nhau quyết định liệu một key có thể gọi một mô hình hay không. Đừng nhầm chúng:
LớpPhạm viCâu hỏi nó trả lời
Quyền workspaceWorkspaceMô hình này có khả dụng cho workspace ở mức nào không?
model_limitsMột keyTrong các mô hình khả dụng, key NÀY có thể dùng cái nào?
model_limits chỉ bao giờ thu hẹp. Một key không thể dùng giới hạn mô hình để vươn tới một mô hình mà bản thân workspace không có quyền — nó chỉ có thể khoét ra một danh sách cho phép nhỏ hơn từ những gì đã được phép. Để cấp cho một key không gì thêmít hơn hẳn, đó chính xác là điều trường này dùng để làm.

6. Vị trí của nó trong tư thế least-agency

Giới hạn mô hình là một dòng của công thức key theo từng agent. Key hữu ích hẹp nhất cho một agent tự chủ ghim tất cả các trục của nó cùng lúc: Khi một key như vậy bị xâm phạm qua prompt injection, bán kính ảnh hưởng bị giới hạn trên mọi trục — bao gồm mô hình nào kẻ tấn công có thể tiêu ngân sách của bạn vào.
Giới hạn mô hình là một ràng buộc danh tính trên key, không phải một chính sách nội dung hay hành động. Chúng không kiểm tra prompt (đó là Guardrails) hay cuộc gọi tool (đó là Firewall) — chúng quyết định, ngay từ đầu, mô hình nào mà key thậm chí được phép gửi đến.

7. Bước tiếp theo

Đối tượng key

Mọi trường mà một key mang theo — giới hạn mô hình, danh sách IP, mức trần, hết hạn, và phần đính kèm chính sách — trong một tham chiếu.

Checklist least-agency

Toàn bộ công thức key theo từng agent: định phạm vi mọi trục về mức tối thiểu mà agent cần.

Phạm vi, key & chính sách

Cách key, guardrails, và chính sách firewall gắn kết với nhau thành một danh tính agent.

Gắn chính sách vào một key

Gắn một guardrail và một chính sách firewall vào cùng một key.
Giới hạn quyền truy cập mô hình theo từng API key là điều khiển agency rẻ nhất bạn có thể áp dụng: một danh sách cho phép, được thực thi ở gateway, mà không một agent bị xâm phạm nào có thể nói vòng qua được.