1. Giới hạn chi tiêu api key: credit_limit_usd
credit_limit_usd là mức trần chi tiêu trọn đời cho một key, biểu thị bằng
USD thuần. Bạn gõ một con số đô la trong trình chỉnh sửa key; OrcaRouter
chuyển nó thành quota khởi đầu của key và đo lường mọi cuộc gọi đối với nó.
Bị giới hạn
credit_limit_usd: 25 đúc một key với $25 chi tiêu. Mỗi cuộc gọi
trừ đi chi phí của nó; một khi số dư còn lại chạm zero, key ngừng ủy
quyền và mọi request sau đó bị từ chối.Không giới hạn
credit_limit_usd: 0 là giá trị sentinel cho không có mức trần —
key rút từ số dư workspace của bạn không có mức trần theo từng key. Tiện
lợi, nhưng bán kính ảnh hưởng tệ nhất nếu nó rò rỉ.2. Cách mức trần được đo lường: remain_quota & used_quota
Mức trần đô la bạn nhập là bề mặt hướng tới con người. Bên dưới nó, gateway
theo dõi hai bộ đếm đang chạy trên key:
| Trường | Ý nghĩa |
|---|---|
remain_quota | Chi tiêu còn lại trước khi key ngừng ủy quyền. |
used_quota | Chi tiêu đã tiêu thụ cho đến nay trong vòng đời của key. |
credit_limit_usd dương gieo remain_quota từ con số đô la đó; mỗi
cuộc gọi được tính phí dịch chuyển chi phí từ remain_quota vào
used_quota. Một key với mức trần không giới hạn mang theo unlimited_quota
thay vào đó, và việc kiểm tra số dư được bỏ qua hoàn toàn.
Một block guardrail hoặc firewall không tốn gì đối với mức trần khi nó
kích hoạt trước khi mô hình chạy — một
guardrail_blocked ở giai đoạn input
và một firewall_blocked inbound đều xảy ra trước đo lường, nên
remain_quota không bị động chạm. Một block guardrail ở giai đoạn output
hoàn lại request. Xem
guardrails và firewall.3. Tự động hết hạn: expired_time
expired_time là một mốc cắt tuyệt đối — một Unix epoch timestamp (giây)
sau đó key ngừng ủy quyền, bất kể còn bao nhiêu ngân sách.
- Một timestamp tương lai cho key hết hạn vào thời khắc đó. Gateway so sánh nó với thời gian hiện tại trên mỗi request và từ chối cuộc gọi một khi nó đã qua.
-1là giá trị sentinel cho không bao giờ hết hạn.
4. Một key bị giới hạn, hết hạn cụ thể
Một job ban đêm đối chiếu hóa đơn bằng một mô hình rẻ, chạy cho một pilot hai tuần, và không bao giờ nên tốn hơn vài đô la mỗi đêm gần như không cần agency nào. Cấu hình key của nó trong trình chỉnh sửa key của console (/console/token — Developer+):
Đặt mức trần chi tiêu
credit_limit_usd: 40 — toàn bộ ngân sách của pilot. Một vòng lặp retry
mất kiểm soát làm cạn key, không phải số dư workspace của bạn.Đặt mốc hết hạn
expired_time: Unix timestamp cho kết thúc của cửa sổ pilot. Key tự
động hết hạn và không thể tái sử dụng sau khi pilot ra mắt.Cả hai trường đều là USD-và-thời-gian trên key, không phải chính sách toàn
workspace. Để giới hạn chi tiêu của một lần chạy agent đơn lẻ (thay vì
vòng đời của một key), verdict
cap_cost của Firewall là cầu dao ngắt mạch
theo từng lần chạy — xem quy tắc firewall.
Hai cái kết hợp: mức trần key ràng buộc vòng đời, cap_cost ràng buộc một
lần chạy đơn lẻ.5. Ai có thể đặt những cái này
Đặtcredit_limit_usd và expired_time là một phần của việc tạo hoặc
chỉnh sửa một key, vốn yêu cầu vai trò Developer trở lên. Bất kỳ thành
viên workspace nào cũng có thể đọc bản ghi đã che của một key; chỉ
Developer+ có thể thay đổi giới hạn của nó. Key bị che khi hiển thị —
plaintext chỉ hiện một lần lúc tạo (xem
che key).
6. Bị giới hạn theo mặc định
Một key vớicredit_limit_usd: 0 và expired_time: -1 không có mức
trần chi tiêu và không bao giờ hết hạn — agency tối đa, bán kính ảnh hưởng
tệ nhất. Hãy biến đó thành ngoại lệ có chủ đích, không phải mặc định.
Không giới hạn vs bị giới hạn
Khi nào một key không mức trần, không hết hạn thực sự là lựa chọn đúng —
và khi nào thì không.
Checklist least-agency
Cho mọi key production đi qua cùng một lượt làm cứng trước khi nó ra mắt.
7. Liên quan
Đối tượng token
Mọi trường trên một key, bao gồm các bộ đếm quota.
Gắn chính sách
Gắn một guardrail và một chính sách firewall vào cùng một key.
Quyền quá mức
Mối đe dọa mà mức trần chi tiêu và hết hạn được xây dựng để kiềm chế.
