Alles hier wird in der Konsole konfiguriert (Security → Firewall), deren
Management-Routen Ihre Session / Ihren Access-Token verwenden — nicht einen
Relay-
sk-orca-…-Key. Die /v1/*-Aufrufe Ihres Agenten ändern sich nicht.1. Warum Pro-Aufruf-Regeln die Kette übersehen
Die Tool-Globs und Argument-Klauseln der Firewall sind per Design zustandslos und deterministisch — sie entscheiden einen Aufruf, schnell, auf dem heißen Pfad. Genau das wollen Sie für „blockiereshell.exec rm -rf”. Es ist genau falsch für eine langsam schwelende
Exfiltration, bei der jeder einzelne Aufruf legal ist.
Zwei komplementäre Werkzeuge füllen die Lücke:
Sequenz-Regeln
Eine Regel, die Sie verfassen und die eine geordnete Kette von Aufrufen
innerhalb eines Zeitfensters matcht — „Bulk-Read → Export → Egress”. Sie
benennen das Muster.
Anomalieerkennung
Die Firewall lernt die normale Tool-Nutzungsform jedes Workspaces und
flaggt Abweichungen — Retry-Loops, nie zuvor gesehene Tool-Pfade und
Volumen-/Kosten-Spikes. Keine Regel zu verfassen.
2. Sequenz-Regeln: die Angriffskette benennen
Einesequence-Regel lebt innerhalb einer
Firewall-Policy wie jede andere Regel,
aber statt eines einzelnen tool_name_glob trägt sie eine geordnete Liste von
Steps. Jeder Step ist ein Tool-Glob mit einem optionalen min_count und
einem optionalen egress: true; die Steps müssen in Reihenfolge auftreten
(Verzahnung mit unverwandten Aufrufen ist in Ordnung), und die ganze Kette muss
innerhalb von window_seconds abgeschlossen sein.
crm.*-Datensätze liest, dann ein beliebiges
*.export-Tool aufruft, dann einen beliebigen Egress-Aufruf macht — alles
innerhalb von zehn Minuten. Jeder Aufruf für sich würde durchgehen; das
Muster ist das Signal.
Die vollständige sequence-Feld-Syntax — window_seconds: 0 für keine
Zeitschranke, min_count-Defaults, Step-Ordnungssemantik — steht im
Regel-Schema. Verfassen Sie Sequenz-Regeln
im Regel-Editor der Konsole; das Speichern ist eine Developer+-Aktion.
3. Anomalieerkennung: Abweichung vom gelernten Normal
Wo Sequenz-Regeln fragen „ist dieses spezifische Muster passiert”, fragt die Anomalieerkennung „ist irgendetwas an diesem Lauf für diesen Workspace abnormal”. Sie braucht keine Regel — die Firewall baut eine Baseline aus Ihrem eigenen Traffic und bewertet Live-Aktivität dagegen. Vier Arten tauchen auf:rate_spike — eine Volumen-Flut
rate_spike — eine Volumen-Flut
Pro-(Tool, Key)-Aufrufvolumen, bewertet gegen die gelernte Baseline für
diese Hour-of-week. Eine Zeile taucht auf, wenn der Zähler einen
absoluten Boden räumt und relativ zur Baseline hoch läuft, oder wenn sein
z-Score die statistische Schwelle überquert. So sticht „100
db.query-Aufrufe um 3 Uhr morgens am Sonntag” heraus, obwohl ein
Dienstag-14-Uhr-Burst derselben Größe es nicht täte.burn_spike — ein Kosten-Spike
burn_spike — ein Kosten-Spike
Dieselbe Idee auf Ausgaben angewandt: ein Tool, das ein Vielfaches seiner
gelernten Baseline-Kosten für diese Hour-of-week verbrennt. Die
Denial-of-Wallet-Frühwarnung — paaren Sie sie mit einer
cap_cost-Regel, um eine harte Obergrenze
durchzusetzen.retry_loop — auf ein fehlschlagendes Tool einhämmern
retry_loop — auf ein fehlschlagendes Tool einhämmern
Eine
(conversation, tool, arguments)-Gruppe, die sich viele Male in einem
engen Fenster wiederholt — ein Agent, der festhängt und dasselbe
fehlschlagende Tool mit denselben Argumenten immer wieder aufruft, statt
langsamen legitimen Pollings.novel_path — ein ungesehener Tool-zu-Tool-Übergang
novel_path — ein ungesehener Tool-zu-Tool-Übergang
Ein
tool_a → tool_b-Übergang, den dieser Workspace noch nie zuvor
gemacht hat. Das erste Mal, dass ein Agent von read_file direkt zu
http_fetch geht, leuchtet diese Kante auf, selbst wenn beide Tools
einzeln erlaubt sind.Die Hour-of-week-Baseline
Die Baseline ist ein 14-tägiger gleitender Durchschnitt, gebucketet nach Hour of week (weekday × 24 + hour), sodass Dienstag-14:00 spezifisch
gegen die vergangene Dienstag-14:00-Historie verglichen wird — nicht ein
flacher All-time-Mittelwert, der Ihren echten täglichen und wöchentlichen
Rhythmus auswaschen würde. Ein brandneuer Workspace ohne gelernte Norm fängt
trotzdem eine offensichtliche Flut über einen absoluten Boden ab, sodass Sie ab
Tag eins geschützt sind.
4. Ein konkreter Durchgang
Angenommen, ein kompromittierter Prompt treibt einen Ihrer Agenten in eine enge Fehlerschleife und sondiert dann einen Export-Pfad, den er nie berührt hat. Das sehen Sie — keine Regel im Voraus verfasst:Der Agent verhält sich daneben
Injizierte Anweisungen drängen den Agenten dazu, ein fehlschlagendes
db.query mit identischen Argumenten erneut zu versuchen, dann
report.export gefolgt von einem ausgehenden Fetch aufzurufen — ein Pfad,
den dieser Workspace nie gelaufen ist.Den Anomalie-Feed öffnen
In Security → Firewall → Anomalies taucht der Lauf mit einem
retry_loop auf db.query und einem novel_path auf der
report.export → http_fetch-Kante auf. Den Feed zu lesen ist eine
Member-Aktion — jeder im Team kann triagieren.Im Events-Trace bestätigen
Klicken Sie durch zum Events-Log und
zur Run-Analytics, um die genaue
Aufrufsequenz zu sehen, korreliert mit dem Agentenlauf und der
Konversation. Der Anomalie-Feed ist Member-lesbar, aber der Events-Log und
der Run-Trace tragen Tool-Call-Provenienz und sind Developer+.
Den Befund in eine Regel umwandeln
Jetzt, da Sie die Kette gesehen haben, kodieren Sie sie: ein
deny auf dem gefährlichen Export,
eine Egress-Allow-List auf dem
Fetch oder eine Sequenz-Regel, die das ganze Muster beim nächsten Mal
auditiert. Anomalieerkennung findet das Unbekannte; eine Regel pinnt das
Bekannte.5. Sequenz-Regeln vs. Anomalieerkennung
Sie lösen benachbarte Probleme — wählen Sie das, das zu Ihrem Wissensstand passt:| Sequenz-Regel | Anomalieerkennung | |
|---|---|---|
| Sie verfassen | Die exakte Kette | Nichts — sie lernt |
| Fängt | Ein bekanntes mehrstufiges Muster | Das Unbekannte / Abnormale |
| Handelt | Wendet das Verdikt der Regel auf den abschließenden Aufruf an (audit / pending_approval / deny) | Taucht auf dem Feed auf |
pending_approval- oder
deny-Verdikt) in der Lage sind, den abschließenden Aufruf zu gaten. Für einen
harten Stopp auf einem einzelnen Aufruf unabhängig von jeder Kette greifen Sie
zu einem Pro-Aufruf-Verdikt.
6. RBAC & die Routen hinter dem Feed
Der Anomalie-Feed und die Sequenz-Regeln sitzen unter den Workspace-Firewall-Management-Routen — Ihr Session- / Access-Token, nie ein Relay-Key:| Methode & Pfad | Rolle | Zweck |
|---|---|---|
GET /api/workspace/firewall/anomalies | Member | Den Anomalie-Feed lesen (?window=). |
POST /api/workspace/firewall/anomalies/snooze | Developer+ | Den Feed snoozen ({until}, auf 7 Tage geklemmt). |
POST /api/workspace/firewall/rules | Developer+ | Eine Sequenz- (oder beliebige) Regel unter einer Policy erstellen. |
POST /api/workspace/firewall/test | Developer+ | Eine Policy gegen einen Beispielaufruf dry-runnen, bevor Sie sich darauf verlassen. |
Wohin als Nächstes
Regel-Schema
Das vollständige
sequence-Feld — Steps, min_count, window_seconds und
jedes andere Regel-Feld.Events-Log
Wo gematchte Sequenzen und Anomalien landen — filtern nach Run, Surface und
Verdikt.
Kosten deckeln
Ein
burn_spike-Signal in eine harte Pro-Lauf-Ausgabenobergrenze
verwandeln.Egress-Kontrolle
Den finalen Exfiltrations-Step einer Kette an der Netzwerkgrenze stoppen.
