1. Hai chế độ
Mỗi key phân giải về đúng một trong hai trạng thái:Không giới hạn
unlimited_quota = true. Key rút từ số dư workspace không có mức trần
theo từng key. Không có kiểm tra chi tiêu nào chạy lúc request — giới
hạn duy nhất là chính số dư của workspace.Bị giới hạn
credit_limit_usd > 0. Key mang theo mức trần chi tiêu trọn đời riêng
của nó bằng USD. Một khi chi tiêu tích lũy chạm mức trần, key ngừng hoạt
động — phần còn lại của workspace không bị động chạm./console/token). Tạo
hoặc chỉnh sửa một key yêu cầu vai trò Developer trở lên.
credit_limit_usd = 0 nghĩa là không giới hạn — zero là giá trị
sentinel cho “không có mức trần”, không phải “một mức trần không-đô-la”. Để
ràng buộc một key, cho nó một số đô la dương.2. Một quota api key được thực thi ra sao
Khi bạn đặtcredit_limit_usd thành một số dương, gateway chuyển nó thành
một số dư remain_quota nội bộ cho key đó và gạt unlimited_quota
thành false. Từ đó về sau:
remain_quotalà khoảng trống chi tiêu còn lại của key, được rút dần khi key tính phí sử dụng.used_quotalà chi tiêu tích lũy mà key đã ghi nhận.- Trên mỗi cuộc gọi relay, gateway kiểm tra key trước khi nó chuyển tiếp
request. Một key bị giới hạn có
remain_quotađã chạm zero bị từ chối là exhausted (đã cạn) — cuộc gọi không bao giờ đến mô hình.
unlimited_quota = true) bỏ qua kiểm tra số dư đó
hoàn toàn; nó chỉ bị ràng buộc bởi số dư workspace và bởi bất kỳ giới hạn ở
cấp key nào khác bạn đặt (danh sách mô hình cho phép, danh sách IP cho phép,
hết hạn).
3. Một ví dụ cụ thể
Giả sử bạn đang triển khai một agent tóm tắt theo lịch và bạn muốn đảm bảo nó không bao giờ có thể tiêu hơn $25 bất kể mô hình làm gì. Đặt mức trần khi bạn tạo key:unlimited_quota = false và
một remain_quota trị giá 25, key cạn và mọi
cuộc gọi /v1/* sau đó bị từ chối — mà bạn không phải canh một dashboard,
và không động tới phần còn lại của workspace.
Để biến cùng key thành không giới hạn về sau, chỉnh sửa nó và gạt công tắc
unlimited — console đặt unlimited_quota = true và credit_limit_usd = 0 cùng nhau, và key có thể rút từ toàn bộ số dư workspace lần nữa.
4. Chọn chế độ nào
Key agent / tự động hóa → bị giới hạn
Key agent / tự động hóa → bị giới hạn
Bất kỳ key nào trao cho một agent tự chủ, một CI job, hoặc một tích hợp
bên thứ ba đều nên bị giới hạn. Một mức trần chi tiêu là bảo đảm rẻ nhất
rằng một vòng lặp prompt-injection hoặc một cơn bão retry không thể chạy
lên một hóa đơn không giới hạn — mức trần dừng key trước khi thiệt hại
cộng dồn. Ghép nó với một giới hạn mô hình
chặt và một danh sách IP cho phép.
Key ngắn hạn / thử nghiệm → bị giới hạn + hết hạn
Key ngắn hạn / thử nghiệm → bị giới hạn + hết hạn
Cho một key chỉ tồn tại cho một demo, một load test, hoặc một lần triển
khai đơn lẻ, kết hợp một
credit_limit_usd nhỏ với một expired_time.
Key tự cho mình nghỉ ở bất kỳ giới hạn nào nó chạm trước. Xem
Quota, mức trần & hết hạn và
Key hết hạn.Key nội bộ tin cậy / khối lượng lớn → không giới hạn
Key nội bộ tin cậy / khối lượng lớn → không giới hạn
Một key dùng bởi một dịch vụ production cốt lõi mà bạn kiểm soát hoàn
toàn, nơi một mức trần theo từng key chỉ gây ra gián đoạn giả, có thể giữ
không giới hạn — số dư workspace là tấm chắn cuối. Giữ số các key này
ít, đặt tên chúng rõ ràng, và vẫn định phạm vi chúng với giới hạn mô
hình và IP.
5. Các trường mức trần liên quan ra sao
Ba trường chi phối cái này là một công tắc đơn lẻ với một số dư dẫn xuất — bạn đặt mức trần đô la, gateway dẫn xuất phần còn lại:| Trường | Ý nghĩa |
|---|---|
credit_limit_usd | Đầu vào của bạn. > 0 = mức trần bị giới hạn bằng USD; 0 = không giới hạn. |
unlimited_quota | true khi key không có mức trần; đặt thành false tự động khi bạn cho một credit_limit_usd dương. |
remain_quota | Khoảng trống chi tiêu dẫn xuất cho một key bị giới hạn; chạm zero làm cạn key. |
credit_limit_usd (hoặc unlimited_quota) trong trình
chỉnh sửa. remain_quota và used_quota được gateway duy trì khi key tính
phí sử dụng — chúng là telemetry chỉ-đọc, hiện ra trong các chế độ xem
usage của console.
6. Vị trí của nó trong control stack
Một mức trần chi tiêu ràng buộc bao nhiêu một key có thể làm; phần còn lại của phạm vi key ràng buộc cái gì nó có thể làm. Hai cái kết hợp:Quota, mức trần & hết hạn
Kết hợp một mức trần đô la với một mốc hết hạn tuyệt đối để một key tự
cho mình nghỉ ở bất kỳ giới hạn nào nó chạm trước.
Đối tượng token
Mọi trường mà một key mang theo — giới hạn mô hình, danh sách IP cho
phép, phần đính kèm chính sách, nhãn môi trường — trong một tham chiếu.
Checklist least-agency
Toàn bộ công thức cho key hẹp nhất có thể, từng ràng buộc một.
Phạm vi, key & chính sách
Cách mức trần khớp vào phân cấp workspace → chính sách → key, và cách
ràng buộc một key thu nhỏ bán kính ảnh hưởng.
