1. 两种模式
每个密钥恰好解析为两种状态之一:无限
unlimited_quota = true。该密钥从工作区余额中支取,没有
按密钥的天花板。请求时不运行花费检查——唯一的限制是工作区
自身的余额。有界
credit_limit_usd > 0。该密钥携带它自己的、以 USD 计的终身
花费上限。一旦累积花费达到上限,密钥就停止工作——工作区的
其余部分毫发无损。/console/token)中设置这个。创建或
编辑一个密钥需要 Developer 角色或以上。
credit_limit_usd = 0 意味着无限——零是 “无上限” 的哨兵值,
而非 “一个零美元上限”。要限定一个密钥,给它一个正的美元数额。2. 一个 api 密钥配额如何被执行
当你把credit_limit_usd 设为一个正数时,网关把它转换成那个
密钥的一个内部 remain_quota 余额,并把 unlimited_quota
翻转为 false。从那以后:
remain_quota是密钥的剩余花费余量,随着密钥计费用量而 被扣减。used_quota是密钥已经记账的累积花费。- 在每个中继调用上,网关在转发请求之前检查密钥。一个
remain_quota已到达零的有界密钥被作为已耗尽拒绝——该 调用从不触及模型。
unlimited_quota = true)完全跳过那个余额检查;
它只被工作区余额以及你设置的任何其他密钥级限制(模型允许列表、
IP 允许列表、到期)所限定。
3. 一个具体的例子
假设你正在部署一个定时汇总智能体,并且你想保证无论模型做什么 它都永远不能花超过 $25。在你创建密钥时设置上限:unlimited_quota = false 以及一个
价值 25 的那一刻,该密钥被耗尽,且每个后续
/v1/* 调用都被拒绝——无需你盯着一个仪表盘,也不触及工作区的
其余部分。
要让同一个密钥之后变为无限,编辑它并翻转 unlimited 开关——
控制台一起设置 unlimited_quota = true 和 credit_limit_usd = 0,于是该密钥可以再次从完整的工作区余额中支取。
4. 选哪种模式
智能体 / 自动化密钥 → 有界
智能体 / 自动化密钥 → 有界
短寿命 / 实验密钥 → 有界 + 到期
短寿命 / 实验密钥 → 有界 + 到期
受信任的内部 / 高吞吐密钥 → 无限
受信任的内部 / 高吞吐密钥 → 无限
一个由你完全掌控的核心生产服务所使用、且按密钥的上限只会
造成虚假中断的密钥,可以保持无限——工作区余额是后盾。把这些
密钥保持得很少,给它们清晰命名,并仍然用模型和 IP 限制为它们
限定范围。
5. 上限字段如何关联
治理这件事的三个字段是一个带派生余额的单一开关——你设置美元 上限,网关派生其余的:| 字段 | 含义 |
|---|---|
credit_limit_usd | 你的输入。> 0 = 以 USD 计的有界上限;0 = 无限。 |
unlimited_quota | 当密钥没有上限时为 true;当你给一个正的 credit_limit_usd 时自动设为 false。 |
remain_quota | 一个有界密钥的派生花费余量;到达零会耗尽该密钥。 |
credit_limit_usd(或 unlimited_quota)。
remain_quota 和 used_quota 由网关随密钥计费用量而维护——
它们是只读遥测,在控制台的使用视图中呈现。
6. 它在控制栈中的位置
一个花费上限限定一个密钥能做多少;密钥范围的其余部分限定它 能做什么。两者组合:配额上限与到期
把一个美元上限与一个绝对到期结合,使一个密钥在它先触及的那个
限制上自行退役。
令牌对象
一个密钥携带的每个字段——模型限制、IP 允许列表、策略附加项、
环境标签——汇于一处参考。
最小权限检查清单
一次一个约束地得到尽可能最狭窄密钥的完整配方。
范围、密钥与策略
上限如何契合工作区 → 策略 → 密钥层级,以及限定一个密钥如何
缩小影响半径。
