1. denial of wallet AI の脅威
denial-of-wallet インシデントは通常、3 つの形のいずれかにたどり着きます:暴走するエージェントループ
暴走するエージェントループ
エージェントが同じ失敗するツールをリトライするか、狭いループで再計画し、毎回の
パスでトークンを再支払いします。悪意は不要です — 悪い停止条件で十分です。
インジェクションされたファンアウト
インジェクションされたファンアウト
プロンプトインジェクションが、エージェントを
ツールのスパムや過大なリクエストの発行に誘導し、ターンごとの支出を倍増させます。
漏洩した、あるいは過剰スコープのキー
漏洩した、あるいは過剰スコープのキー
キーがあるべきでない場所 — コミットされた
.env、共有ノートブック — に行き着き、
攻撃者が支出に気づかれるまであなたのアカウントで推論を実行します。2. cap_cost による実行ごとのコスト天井
ファイアウォールの cap_cost 判定は、暴走ループのためのサーキットブレーカーです。
実行ごとのセント上限を持つルールとして記述します;エンジンはエージェント実行の累積
支出を合計し、実行が上限を越えると、判定を deny に解決します — その実行内の以降の
すべてのツール呼び出しがブロックされます。
cap_cost はディスパッチ前の天井です:呼び出しがツールに到達する前に評価される
ため、すでに行われた呼び出しを返金するのではなく、次の高価な呼び出しを止めます。
すべてのツールに対する典型的なキャッチオール上限:
firewall_blocked で
拒否され — skip-retry とマークされるため、ループは拒否の周りを叩けません。天井は
エージェント実行ごとで、ワークスペースポリシー全体にわたって合計されるため、
1 つの暴走会話が別の会話の予算に出血することはありません。
完全なマッチング言語と、cap_cost が他の判定の中でどこに座るかについては、
ファイアウォールルールリファレンスを参照してください。
3. credit_limit_usd によるキーごとのハード予算
cap_cost は単一の実行を制限します。キー — それが発行するすべての実行 — を
制限するには、API キーに credit_limit_usd を設定します。そのキーの生涯支出に対する
ハードな USD 天井です:ゲートウェイはそれをキーの残りクォータに変換し、キーが割当を
使い切ると、それ以降のリレー呼び出しはクレジット不足で拒否されます。0 は無制限を
意味します。
漏洩したキーがすべての軸で一度に制限されるよう、キーの他のスコープとペアにします:
credit_limit_usd
キーのハードな USD 支出天井(
0 = 無制限)。expired_time
自動失効タイムスタンプ(
-1 = 決して失効しない)。短命のキーは爆発半径の
ウィンドウを制限します。allow_ips
キーを既知のソース IP に固定 — 漏洩したキーはネットワーク外では無用です。
model_limits
キーを特定のモデルに制限し、最も高価なものに一切到達できないようにします。
credit_limit_usd を持つ独自の狭く
スコープされたキーを与えてください。上限は予算であり、攻撃者の挙動の推測ではありません —
完全に侵害されたキーでも天井で止まります。
これらすべてを、あなたのセッション下でコンソールのキーエディタ(またはトークン API)
から設定します — これらはキー設定であり、リレー呼び出しではありません。
/v1/* 推論
リクエストだけが sk-orca-... キー自体を使います。上限の編集はキーの次のリクエストで
反映されます;再デプロイ不要。4. 予測しなかったスパイクを捕捉する:コスト異常
静的な上限は、予期した支出を止めます。ファイアウォールの異常検出は、予期しなかった 支出を捕捉します。各ワークスペースの正常なツール使用の形を曜日内時間ベースライン (14 日間の移動平均)に対して学習し、Member が読めるフィードで逸脱を表面化します:| 異常 | フラグするもの |
|---|---|
burn_spike | ツールのコストが学習されたベースラインコストをはるかに上回る — denial-of-wallet シグナル。 |
rate_spike | 呼び出しボリュームがベースラインをはるかに上回る — ファンアウトとフラッド。 |
retry_loop | 同じツールが同じ引数で狭いウィンドウで繰り返される — 古典的な暴走ループ。 |
5. 組み合わせる
暴走が決して請求に到達しないよう、3 つを重ねます:| コントロール | スコープ | 発火するとき |
|---|---|---|
cap_cost ルール | 1 つのエージェント実行 | 実行の累積支出がセント上限を越える |
credit_limit_usd | 1 つのキー、生涯 | キーの総支出がその USD 天井に達する |
burn_spike / retry_loop | ワークスペース、学習 | 支出または繰り返しパターンがベースラインから逸脱 |
* に対する実行ごとの cap_cost、すべてのエージェントキーへの
credit_limit_usd、そして異常フィードを確認する習慣。新しい cap_cost ポリシーは
まずシャドウモードでロールアウト
してください — ブロックせずに [shadow] would deny をログするので、噛みつく前に実際の
トラフィックに対して上限のサイズを決められます。
6. 関連する脅威
denial of wallet が単独で到着することはめったにありません — 予算を焼くループは、しばしば 上流の何かによって駆動されます:- プロンプトインジェクション — インジェクションされた指示は、ファンアウトとツールスパムの一般的なトリガーです。
- 過剰なエージェンシー — 自由度の高すぎる エージェントは支出する手段が多くあります。
- 危険なツール呼び出し — 同じ ファイアウォールルールプレーンが、コストだけでなくツールが何をしてよいかを 制限します。
- 脅威モデル — 暴走コストが完全なエージェント 攻撃サーフェスのどこに収まるか。
ファイアウォール概要
判定、異常検出、自律性レベル、可観測性。
スコープされたキーとポリシー
キー上限、ガードレール、ファイアウォールポリシーがキーごとにどう組み合わさるか。
