1. 2 つのモード
すべてのキーは、ちょうど 2 つの状態のいずれかに解決します:無制限
unlimited_quota = true。キーはキーごとの上限なしにワークスペース残高を引き出します。
リクエスト時に支出チェックは実行されません — 唯一の制限はワークスペース自身の残高です。境界づけ
credit_limit_usd > 0。キーは USD で独自の生涯支出上限を運びます。累積支出が上限に達すると、
キーは機能を停止します — ワークスペースの残りは無傷です。/console/token)で設定します。キーの作成または編集には
Developer ロール以上が必要です。
credit_limit_usd = 0 は無制限を意味します — ゼロは「ゼロドル上限」ではなく「上限なし」の
センチネルです。キーを境界づけるには、正のドル金額を与えてください。2. API キークォータがどう強制されるか
credit_limit_usd を正の数に設定すると、ゲートウェイはそれをそのキーの内部 remain_quota
残高に変換し、unlimited_quota を false に切り替えます。それ以降:
remain_quotaは、キーが使用量を課金するにつれて引き落とされる、キーの残り支出余地です。used_quotaは、キーがすでに計上した累積支出です。- すべてのリレー呼び出しで、ゲートウェイはリクエストを転送する前にキーをチェックします。
remain_quotaがゼロに達した境界づけられたキーは、枯渇として拒否されます — 呼び出しは モデルに決して到達しません。
unlimited_quota = true)はその残高チェックを完全にスキップします;それは
ワークスペース残高と、あなたが設定した他のキーレベルの制限(モデル許可リスト、IP 許可リスト、
失効)によってのみ境界づけられます。
3. ひとつの具体例
スケジュール要約エージェントをデプロイしていて、モデルが何をしようと**$25** を超えて費やせない ことを保証したいとしましょう。キーを作成するときに上限を設定します:unlimited_quota = false と 25 に達した瞬間、キーは枯渇し、それ以降のすべての /v1/* 呼び出しが拒否されます —
あなたがダッシュボードを見ることなく、ワークスペースの残りに触れることなく。
後で同じキーを無制限にするには、それを編集して無制限トグルを切り替えます — コンソールは
unlimited_quota = true と credit_limit_usd = 0 を一緒に設定し、キーは再び完全なワークスペース
残高を引き出せます。
4. どちらのモードを選ぶか
エージェント / 自動化キー → 境界づけ
エージェント / 自動化キー → 境界づけ
短命 / 実験キー → 境界づけ + 失効
短命 / 実験キー → 境界づけ + 失効
信頼できる内部 / 大量キー → 無制限
信頼できる内部 / 大量キー → 無制限
あなたが完全に制御するコアの本番サービスが使うキーで、キーごとの上限がただ偽の障害を
引き起こすだけの場合、無制限のままでよい — ワークスペース残高がバックストップです。これらの
キーを少数に保ち、明確に名付け、それでもモデルと IP の制限でスコープしてください。
5. 上限フィールドがどう関係するか
これを統制する 3 つのフィールドは、派生残高を伴う単一のスイッチです — ドル上限を設定すると、 ゲートウェイが残りを導出します:| フィールド | 意味 |
|---|---|
credit_limit_usd | あなたの入力。> 0 = USD での境界づけ上限;0 = 無制限。 |
unlimited_quota | キーに上限がないとき true;正の credit_limit_usd を与えると自動的に false に設定。 |
remain_quota | 境界づけられたキーの派生支出余地;ゼロに達するとキーを枯渇させます。 |
credit_limit_usd(または unlimited_quota)だけです。remain_quota と
used_quota は、キーが使用量を課金するにつれてゲートウェイによって維持されます — それらは
読み取り専用のテレメトリで、コンソールの使用量ビューに表示されます。
6. コントロールスタックにおける位置
支出上限はキーがどれだけできるかを境界づけ;キーのスコープの残りはキーが何をできるかを 境界づけます。この 2 つは組み合わさります:クォータ上限と失効
ドル上限を絶対的な失効と組み合わせて、キーが最初に当たった制限で自己退役するようにします。
トークンオブジェクト
キーが運ぶすべてのフィールド — モデル制限、IP 許可リスト、ポリシーアタッチメント、environment
ラベル — を 1 つのリファレンスに。
最小権限チェックリスト
可能な限り狭いキーのための完全なレシピ、一度に 1 つの制約。
スコープ、キー、ポリシー
上限がワークスペース → ポリシー → キーの階層にどうフィットするか、そしてキーを境界づけることが
どのように被害範囲を縮めるか。
