1. Die Denial-of-Wallet-KI-Bedrohung
Ein Denial-of-Wallet-Vorfall lässt sich meist auf eine von drei Formen zurückführen:Außer Kontrolle geratene Agenten-Schleife
Außer Kontrolle geratene Agenten-Schleife
Ein Agent wiederholt dasselbe fehlschlagende Tool oder plant in einer engen
Schleife neu und zahlt bei jedem Durchgang erneut für Tokens. Keine
Bösartigkeit nötig — eine schlechte Abbruchbedingung reicht.
Injizierter Fan-out
Injizierter Fan-out
Eine Prompt-Injection steuert den
Agenten dazu, ein Tool zu spammen oder übergroße Requests auszugeben, was
die Ausgaben pro Zug vervielfacht.
Geleakter oder über-gescopeter Key
Geleakter oder über-gescopeter Key
Ein Key landet, wo er nicht sollte — eine committete
.env, ein geteiltes
Notebook — und ein Angreifer läuft Inferenz auf Ihrem Konto, bis die
Ausgaben bemerkt werden.2. Pro-Lauf-Kosten-Obergrenze mit cap_cost
Das cap_cost-Verdikt der Firewall ist ein Schutzschalter für außer Kontrolle
geratene Schleifen. Sie verfassen es als Regel mit einer Pro-Lauf-Cent-Obergrenze;
die Engine summiert die akkumulierten Ausgaben des Agentenlaufs, und sobald der
Lauf die Obergrenze überschreitet, löst es das Verdikt zu deny auf — jeder
spätere Tool-Call in diesem Lauf wird blockiert.
cap_cost ist eine Pre-Dispatch-Obergrenze: Sie wertet aus, bevor der
Aufruf das Tool erreicht, sodass sie den nächsten teuren Aufruf stoppt, statt
einen bereits getätigten zu erstatten. Eine typische Catch-all-Obergrenze auf
jedem Tool:
firewall_blocked abgelehnt — als skip-retry markiert, sodass die
Schleife nicht um die Ablehnung herumhämmern kann. Die Obergrenze ist pro
Agentenlauf und über Ihre gesamte Workspace-Policy summiert, sodass eine
außer Kontrolle geratene Konversation nicht in das Budget einer anderen bluten
kann.
Siehe die Firewall-Regeln-Referenz für die
vollständige Matching-Sprache und wo cap_cost unter den anderen Verdikten
sitzt.
3. Hartes Budget pro Key mit credit_limit_usd
cap_cost begrenzt einen einzelnen Lauf. Um einen Key zu begrenzen — jeden
Lauf, den er je ausgibt — setzen Sie credit_limit_usd auf dem API-Key. Es ist
eine harte USD-Obergrenze für die Lebenszeit-Ausgaben dieses Keys: Das Gateway
wandelt sie in das verbleibende Kontingent des Keys um, und sobald der Key
seine Zuteilung verausgabt hat, werden weitere Relay-Aufrufe wegen
unzureichenden Guthabens abgelehnt. 0 bedeutet unbegrenzt.
Paaren Sie es mit den anderen Scopes des Keys, sodass ein geleakter Key auf
jeder Achse zugleich begrenzt ist:
credit_limit_usd
Harte USD-Ausgaben-Obergrenze für den Key (
0 = unbegrenzt).expired_time
Auto-Ablauf-Zeitstempel (
-1 = nie). Ein kurzlebiger Key begrenzt das
Wirkungsradius-Fenster.allow_ips
Den Key an bekannte Quell-IPs pinnen — ein geleakter Key ist außerhalb des
Netzwerks nutzlos.
model_limits
Den Key auf bestimmte Modelle beschränken, sodass er die teuersten
überhaupt nicht erreichen kann.
credit_limit_usd, das er legitim nie überschreiten sollte. Das Limit ist das
Budget, keine Vermutung über das Verhalten des Angreifers — selbst ein
vollständig kompromittierter Key stoppt an der Obergrenze.
Konfigurieren Sie all das aus dem Konsolen-Key-Editor (oder der Token-API)
unter Ihrer Session — das sind Key-Einstellungen, keine Relay-Aufrufe. Nur die
/v1/*-Inferenz-Requests verwenden den sk-orca-...-Key selbst. Das
Bearbeiten des Limits tritt beim nächsten Request des Keys in Kraft; kein
Redeploy.4. Den Spike abfangen, den Sie nicht vorhergesagt haben: Kosten-Anomalien
Eine statische Obergrenze stoppt Ausgaben, die Sie erwartet haben. Die Anomalieerkennung der Firewall fängt die Ausgaben, die Sie nicht erwartet haben. Sie lernt die normale Tool-Nutzungsform jedes Workspaces gegen eine Hour-of-week-Baseline (ein gleitender 14-Tage-Durchschnitt) und macht Abweichungen auf einem Member-lesbaren Feed sichtbar:| Anomalie | Was sie flaggt |
|---|---|
burn_spike | Kosten für ein Tool weit über seinen gelernten Baseline-Kosten — das Denial-of-Wallet-Signal. |
rate_spike | Aufrufvolumen weit über der Baseline — Fan-out und Fluten. |
retry_loop | Dasselbe Tool mit denselben Argumenten, das in einem engen Fenster wiederholt — die klassische außer Kontrolle geratene Schleife. |
5. Alles zusammensetzen
Schichten Sie die drei, sodass ein Ausreißer nie die Rechnung erreicht:| Kontrolle | Scope | Wann sie feuert |
|---|---|---|
cap_cost-Regel | Ein Agentenlauf | Die akkumulierten Ausgaben des Laufs überschreiten die Cent-Obergrenze |
credit_limit_usd | Ein Key, lebenslang | Die Gesamtausgaben des Keys erreichen seine USD-Obergrenze |
burn_spike / retry_loop | Workspace, gelernt | Ausgaben oder Wiederhol-Pattern weichen von der Baseline ab |
cap_cost auf *, ein
credit_limit_usd auf jedem Agenten-Key und die Gewohnheit, den Anomalie-Feed
zu prüfen. Rollen Sie eine neue cap_cost-Policy zuerst im
Shadow-Mode aus — er loggt
[shadow] would deny, ohne zu blockieren — sodass Sie die Obergrenze gegen
echten Traffic dimensionieren können, bevor sie zubeißt.
6. Verwandte Bedrohungen
Denial of Wallet kommt selten allein an — die Schleife, die Ihr Budget verbrennt, wird oft von etwas Upstream angetrieben:- Prompt-Injection — injizierte Anweisungen sind ein häufiger Auslöser für Fan-out und Tool-Spam.
- Übermäßige Handlungsmacht — ein Agent mit zu viel Spielraum hat mehr Möglichkeiten auszugeben.
- Gefährliche Tool-Calls — dieselbe Firewall-Regel-Ebene begrenzt, was ein Tool tun darf, nicht nur, wie viel es kostet.
- Das Bedrohungsmodell — wo außer Kontrolle geratene Kosten in die volle agentische Angriffsfläche passen.
Firewall-Überblick
Verdikte, Anomalieerkennung, Autonomie-Stufen und Observability.
Scoped Keys & Policies
Wie Key-Limits, Guardrails und Firewall-Policies pro Key komponieren.
