Die Secure-Agents-Baseline ist die Autonomie-Kontrolle — es gibt kein
separates „Baseline”-Objekt. Das Anwenden eines Autonomie-Levels schreibt
atomar eine Firewall-Policy und ein Guardrail (benannt nach dem Level) und
macht sie zur Live-Haltung Ihres Workspaces, in einer Transaktion. Sie können
diese danach öffnen und bearbeiten. Ein-Klick-Undo stellt den vorherigen
Zustand aus einem Audit-Snapshot wieder her.
1. Was die Autonomie-Kontrolle tut
Drei Level, jedes deckt dieselben zwei Ebenen ab:| Level | Firewall-Haltung | Guardrails | Observe-Mode |
|---|---|---|---|
tight | Standard-Deny; destruktive Shell und SSRF-Egress verweigert | PII-Shield + Secrets-Blocker durchgesetzt | Aus |
balanced | Standardmäßig auditieren; destruktive Shell verweigert | PII-Shield im Nur-Audit-Modus (markiert PII) | Aus |
permissive | Keine durchsetzende Policy | Keine Guardrails | An — jeder Tool-Call wird als Abdeckungslücke geloggt |
balanced ist die empfohlene Ausgangshaltung. Es auditiert alles, was
Ihre Agenten tun, und markiert PII, verweigert aber trotzdem die destruktivsten
Aktionen (destruktive Shell) — damit sehen Sie das echte Verhalten Ihrer Agenten,
bevor Sie entscheiden, was sonst noch eingeschränkt werden soll. Für einen
Durchlauf, der nichts blockiert, starten Sie bei permissive.
tight ist das richtige Ziel, sobald Sie das normale Verhalten Ihres
Agenten verstehen. Es setzt eine Standard-Deny-Haltung out-of-the-box durch:
destruktive Shell verweigert, SSRF-Egress verweigert, und sowohl PII-Shield als
auch Secrets-Blocker-Guardrails aktiv (Ihre Requests auf PII und Secrets prüfen).
permissive schaltet alle Durchsetzung aus, lässt aber Observe-Mode an,
damit jeder Tool-Call trotzdem geloggt wird. Verwenden Sie es, um einen
brandneuen Agenten ohne Risiko versehentlicher Blocks zu auditieren — dann
wechseln Sie zu balanced oder tight, sobald Sie wissen, was er tut.
2. Wie ein Level angewendet wird
Die Änderung vorschauen (optional, aber empfohlen)
Simulieren Sie das Level, bevor Sie es anwenden. Die Konsolen-Simulate-
Ansicht (unter Firewall → Posture) oder die API zeigt genau, welche Regeln
und Guardrails aktiv wären — nichts ändert sich.Rolle: Member (schreibgeschützt, keine Änderung).
Ein Level in der Konsole wählen
Gehen Sie zu Firewall → Posture in der Konsole. Wählen Sie
balanced,
tight oder permissive aus der Autonomie-Level-Kontrolle und bestätigen
Sie. Die Änderung tritt beim nächsten Tool-Call in Kraft — kein Redeploy.Rolle: Developer+ erforderlich zum Anwenden.Oder über die API anwenden
audit_id — behalten Sie diese. Sie benötigen
sie für Undo.Rolle: Developer+.Events und Matches beobachten
Gehen Sie nach dem Anwenden zu Firewall → Events / Runs, um
Tool-Call-Verdikte zu sehen, und zu Guardrails → Matches, um
Content-Policy-Treffer zu sehen. Beide Feeds aktualisieren sich in
Echtzeit. Wenn etwas auslöst, das Sie nicht erwartet haben, überprüfen
Sie es, bevor Sie weiter verschärfen.
Rückgängig machen, falls nötig
Jede Autonomie-Änderung kann mit einem Aufruf rückgängig gemacht werden.
Das Undo stellt den exakten vorherigen Zustand wieder her — Policies,
Regeln, Guardrails, Einstellungen — aus dem Audit-Snapshot, kein
generischer Reset.Rolle: Developer+.Die
audit_id wird zurückgegeben, wenn Sie das Level anwenden (Schritt 3)
und ist auch in Firewall → Audit sichtbar.3. Der empfohlene Pfad
Starten Siebalanced → simulieren Sie tight → beobachten → verschärfen.
balancedanwenden — Sie erhalten einen vollständigen Audit-Trail; nur destruktive Shell wird verweigert, alles andere wird auditiert. Führen Sie Ihre Agenten einen oder zwei Tage normal aus.tightsimulieren — führen SieGET /api/workspace/firewall/simulate?level=tightaus und vergleichen Sie, was verweigert würde, mit dem, was Sie im Events-Feed gesehen haben. Wenn destruktive Shell-Aufrufe oder SSRF-ähnliche ausgehende Requests Teil Ihres normalen Traffics sind, beheben Sie diese zuerst im Agenten.- Events und Matches beobachten — Firewall → Events zeigt jedes Tool-Call-Verdikt; Guardrails → Matches zeigt Content-Policy-Treffer. Beide sind nach Verdikt, Tool, Lauf und Session filterbar.
tightanwenden — sobald die Simulate-Ausgabe keine Überraschungen enthält, wenden Sietightan. Undo ist ein Aufruf entfernt, wenn etwas in Produktion bricht.- Mit Regeln abstimmen — verwenden Sie Firewall-Regeln, um Ausnahmen zu schnitzen oder Kontrollen hinzuzufügen, die die Preset-Level nicht abdecken. Das Autonomie-Level ist Ihr Boden; benutzerdefinierte Regeln fügen Präzision hinzu.
4. Rollenanforderungen
| Aktion | Mindestrolle |
|---|---|
Ein Level simulieren (GET .../simulate) | Member |
| Den Audit-Trail lesen | Member |
| Guardrail-Matches anzeigen | Member |
| Firewall-Events & Runs anzeigen | Developer+ |
| Ein Autonomie-Level anwenden | Developer+ |
| Eine Autonomie-Änderung rückgängig machen | Developer+ |
5. Was das nicht ist
- Keine Black Box. Das Anwenden eines Autonomie-Levels schreibt eine echte Firewall-Policy und ein Guardrail (benannt nach dem Level) und macht sie zur Live-Haltung Ihres Workspaces. Sie können sie danach öffnen, inspizieren und bearbeiten — es ist ein schneller Ausgangspunkt, kein gesperrtes Preset.
- Reversibel, mit Einschränkungen. Ein-Klick-Undo stellt den vorherigen Firewall- und Guardrails-Zustand aus einem Audit-Snapshot wieder her. Für einen sehr großen Workspace, dessen Snapshot die Audit-Log-Größenbeschränkung überschreitet, gelingt das Anwenden trotzdem, aber Undo ist für diese Änderung nicht verfügbar — Sie wenden dann das gewünschte Level erneut an. Selten, aber wissenswert.
- Kein Ersatz für Scoped Keys. Die Autonomie-Kontrolle setzt die Standard-Haltung des Workspaces. Individuelle API-Keys können trotzdem an spezifische Policies für feinere Kontrolle gebunden werden. Siehe Guardrails vs. Firewall für das Zusammenwirken der Ebenen.
Die Autonomie-Kontrolle ist für die ersten 30 Minuten ausgelegt — schnell geschützt, echtes Verhalten Ihrer Agenten verstehen, dann aus einer Position der Sichtbarkeit verschärfen, nicht aus Rätselraten.
Quickstart
Vollständiges Zero-Trust-Setup in 5 Minuten, einschließlich Scoped Keys
und Guardrails.
Firewall
Regeldetails — Verdikte, Surfaces, Argument-Prädikate und HITL-Freigabe.
