1. denial of wallet ai 위협
denial-of-wallet 사고는 대개 세 가지 형태 중 하나로 추적됩니다:폭주하는 에이전트 루프
폭주하는 에이전트 루프
에이전트가 동일하게 실패하는 툴을 재시도하거나 짧은 루프에서 재계획하며,
매 패스마다 토큰 비용을 다시 지불합니다. 악의는 필요 없습니다 — 나쁜
종료 조건만으로 충분합니다.
주입된 팬아웃
주입된 팬아웃
프롬프트 인젝션이 에이전트를
툴 스팸이나 과대 요청 발행으로 조종하여, 턴당 지출을 증식시킵니다.
유출되거나 과도하게 범위 지정된 키
유출되거나 과도하게 범위 지정된 키
키가 있어서는 안 될 곳 — 커밋된
.env, 공유 노트북 — 에 도달하고,
공격자가 지출이 인지될 때까지 여러분의 계정에서 추론을 실행합니다.2. cap_cost로 실행별 비용 천장
Firewall의 cap_cost 판정은 폭주 루프를 위한 회로 차단기입니다. 실행별
센트 상한이 있는 규칙으로 작성하면; 엔진이 에이전트 실행의 누적 지출을
합산하고, 실행이 상한을 넘는 순간 판정을 deny로 해석합니다 — 그 실행의
이후 모든 툴 호출이 차단됩니다.
cap_cost는 디스패치 전 천장입니다: 호출이 툴에 도달하기 전에
평가되므로, 이미 이루어진 호출을 환불하기보다 다음 비싼 호출을
멈춥니다. 모든 툴에 대한 전형적인 포괄 상한:
firewall_blocked으로 거부됩니다 — skip-retry로 표시되므로 루프가
거부 주위를 두드릴 수 없습니다. 천장은 에이전트 실행별이며 전체
워크스페이스 정책에 걸쳐 합산되므로, 하나의 폭주 대화가 다른 대화의 예산으로
새어 들어갈 수 없습니다.
전체 매칭 언어와 cap_cost가 다른 판정들 사이에서 어디에 위치하는지는
Firewall 규칙 레퍼런스를 참조하세요.
3. credit_limit_usd로 키당 단단한 예산
cap_cost는 단일 실행을 한정합니다. 키 — 그것이 발행하는 모든 실행 —
를 한정하려면 API 키에 credit_limit_usd를 설정하세요. 그것은 그 키의
수명 지출에 대한 단단한 USD 천장입니다: 게이트웨이가 그것을 키의 남은
쿼터로 변환하고, 키가 할당량을 다 쓰면 이후 릴레이 호출은 크레딧 부족으로
거부됩니다. 0은 무제한을 의미합니다.
유출된 키가 모든 축에서 한 번에 한정되도록 키의 다른 범위들과 짝지으세요:
credit_limit_usd
키에 대한 단단한 USD 지출 천장 (
0 = 무제한).expired_time
자동 만료 타임스탬프 (
-1 = 절대 안 함). 수명이 짧은 키는 폭발 반경
윈도우를 한정합니다.allow_ips
키를 알려진 소스 IP에 고정 — 유출된 키는 네트워크 밖에서 쓸모없습니다.
model_limits
키를 특정 모델로 제한하여, 가장 비싼 것에 아예 도달할 수 없게 합니다.
credit_limit_usd를 가진
자체의 좁게 범위 지정된 키를 주세요. 한도는 예산이지 공격자 행동에 대한
추측이 아닙니다 — 완전히 손상된 키조차 천장에서 멈춥니다.
이 모든 것을 여러분의 세션 하에 콘솔 키 편집기(또는 token API)에서
구성하세요 — 이것들은 키 설정이지 릴레이 호출이 아닙니다.
/v1/* 추론
요청만 sk-orca-... 키 자체를 사용합니다. 한도 편집은 키의 다음 요청에서
적용됩니다; 재배포 없음.4. 예측하지 못한 급증 포착: 비용 이상
정적 상한은 여러분이 예상한 지출을 멈춥니다. Firewall의 이상 탐지는 예상하지 못한 지출을 포착합니다. 각 워크스페이스의 정상적인 툴 사용 형태를 주중 시간대 베이스라인(14일 롤링 평균)에 대해 학습하고 Member가 읽을 수 있는 피드에서 편차를 드러냅니다:| 이상 | 플래그하는 것 |
|---|---|
burn_spike | 한 툴의 학습된 베이스라인 비용을 훨씬 넘는 비용 — denial-of-wallet 신호. |
rate_spike | 베이스라인을 훨씬 넘는 호출 양 — 팬아웃과 홍수. |
retry_loop | 짧은 윈도우에서 반복되는 동일 인자의 동일 툴 — 전형적인 폭주 루프. |
5. 종합하기
폭주가 결코 청구서에 도달하지 않도록 셋을 계층화하세요:| 컨트롤 | 범위 | 언제 발동하는가 |
|---|---|---|
cap_cost 규칙 | 하나의 에이전트 실행 | 실행의 누적 지출이 센트 상한을 넘음 |
credit_limit_usd | 하나의 키, 수명 | 키의 총 지출이 USD 천장에 도달 |
burn_spike / retry_loop | 워크스페이스, 학습됨 | 지출이나 반복 패턴이 베이스라인에서 벗어남 |
*에 대한 실행별 cap_cost, 모든 에이전트 키의
credit_limit_usd, 그리고 이상 피드를 확인하는 습관. 새 cap_cost 정책을
먼저 shadow mode로
롤아웃하세요 — 차단 없이 [shadow] would deny를 로깅합니다 — 따라서 그것이
물기 전에 실제 트래픽에 대해 상한 크기를 정할 수 있습니다.
6. 관련 위협
Denial of wallet은 혼자 도착하는 경우가 드뭅니다 — 여러분의 예산을 태우는 루프는 종종 업스트림의 무언가에 의해 구동됩니다:- 프롬프트 인젝션 — 주입된 지시사항은 팬아웃과 툴 스팸의 흔한 트리거입니다.
- 과도한 자율성 — 너무 많은 여지를 가진 에이전트는 지출할 방법이 더 많습니다.
- 위험한 툴 호출 — 동일한 firewall 규칙 평면이 비용뿐 아니라 툴이 무엇을 할 수 있는지를 한정합니다.
- 위협 모델 — 폭주 비용이 전체 에이전트 공격 표면에서 어디에 들어맞는지.
Firewall 개요
판정, 이상 탐지, 자율성 수준, 그리고 관측성.
범위 지정 키 & 정책
키 한도, guardrails, 그리고 firewall 정책이 키별로 어떻게 조합되는지.
