Die Secure-Agents-Baseline

Sie müssen keine einzige Firewall-Regel verfassen, um geschützt zu sein. Die Autonomie-Kontrolle — auch als Secure-Agents-Baseline bezeichnet — wendet eine vollständige Zero-Trust-Haltung auf Ihren Workspace in einer Transaktion an: Firewall und Guardrails, zusammen, mit Ein-Klick-Undo. Dies ist der schnellste Weg zu einer bedeutsamen Sicherheitshaltung. Verfassen Sie Regeln später zum Abstimmen; starten Sie hier.

Die Secure-Agents-Baseline ist die Autonomie-Kontrolle — es gibt kein separates „Baseline”-Objekt. Das Anwenden eines Autonomie-Levels schreibt atomar eine Firewall-Policy und ein Guardrail (benannt nach dem Level) und macht sie zur Live-Haltung Ihres Workspaces, in einer Transaktion. Sie können diese danach öffnen und bearbeiten. Ein-Klick-Undo stellt den vorherigen Zustand aus einem Audit-Snapshot wieder her.

1. Was die Autonomie-Kontrolle tut

Drei Level, jedes deckt dieselben zwei Ebenen ab:

Level	Firewall-Haltung	Guardrails	Observe-Mode
`tight`	Standard-Deny; destruktive Shell und SSRF-Egress verweigert	PII-Shield + Secrets-Blocker durchgesetzt	Aus
`balanced`	Standardmäßig auditieren; destruktive Shell verweigert	PII-Shield im Nur-Audit-Modus (markiert PII)	Aus
`permissive`	Keine durchsetzende Policy	Keine Guardrails	An — jeder Tool-Call wird als Abdeckungslücke geloggt

balanced ist die empfohlene Ausgangshaltung. Es auditiert alles, was Ihre Agenten tun, und markiert PII, verweigert aber trotzdem die destruktivsten Aktionen (destruktive Shell) — damit sehen Sie das echte Verhalten Ihrer Agenten, bevor Sie entscheiden, was sonst noch eingeschränkt werden soll. Für einen Durchlauf, der nichts blockiert, starten Sie bei permissive. tight ist das richtige Ziel, sobald Sie das normale Verhalten Ihres Agenten verstehen. Es setzt eine Standard-Deny-Haltung out-of-the-box durch: destruktive Shell verweigert, SSRF-Egress verweigert, und sowohl PII-Shield als auch Secrets-Blocker-Guardrails aktiv (Ihre Requests auf PII und Secrets prüfen). permissive schaltet alle Durchsetzung aus, lässt aber Observe-Mode an, damit jeder Tool-Call trotzdem geloggt wird. Verwenden Sie es, um einen brandneuen Agenten ohne Risiko versehentlicher Blocks zu auditieren — dann wechseln Sie zu balanced oder tight, sobald Sie wissen, was er tut.

2. Wie ein Level angewendet wird

Die Änderung vorschauen (optional, aber empfohlen)

Simulieren Sie das Level, bevor Sie es anwenden. Die Konsolen-Simulate- Ansicht (unter Firewall → Posture) oder die API zeigt genau, welche Regeln und Guardrails aktiv wären — nichts ändert sich.

# Simulate tight — gibt den vollständigen Policy-Diff zurück, nichts wird angewendet
GET /api/workspace/firewall/simulate?level=tight

Rolle: Member (schreibgeschützt, keine Änderung).

Ein Level in der Konsole wählen

Gehen Sie zu Firewall → Posture in der Konsole. Wählen Sie balanced, tight oder permissive aus der Autonomie-Level-Kontrolle und bestätigen Sie. Die Änderung tritt beim nächsten Tool-Call in Kraft — kein Redeploy.Rolle: Developer+ erforderlich zum Anwenden.

Oder über die API anwenden

POST /api/workspace/firewall/autonomy
Content-Type: application/json

{ "level": "balanced" }

Die Antwort enthält eine audit_id — behalten Sie diese. Sie benötigen sie für Undo.Rolle: Developer+.

Events und Matches beobachten

Gehen Sie nach dem Anwenden zu Firewall → Events / Runs, um Tool-Call-Verdikte zu sehen, und zu Guardrails → Matches, um Content-Policy-Treffer zu sehen. Beide Feeds aktualisieren sich in Echtzeit. Wenn etwas auslöst, das Sie nicht erwartet haben, überprüfen Sie es, bevor Sie weiter verschärfen.

Rückgängig machen, falls nötig

Jede Autonomie-Änderung kann mit einem Aufruf rückgängig gemacht werden. Das Undo stellt den exakten vorherigen Zustand wieder her — Policies, Regeln, Guardrails, Einstellungen — aus dem Audit-Snapshot, kein generischer Reset.

POST /api/workspace/firewall/autonomy/undo/:audit_id

Rolle: Developer+.Die audit_id wird zurückgegeben, wenn Sie das Level anwenden (Schritt 3) und ist auch in Firewall → Audit sichtbar.

3. Der empfohlene Pfad

Starten Sie balanced → simulieren Sie tight → beobachten → verschärfen.

balanced anwenden — Sie erhalten einen vollständigen Audit-Trail; nur destruktive Shell wird verweigert, alles andere wird auditiert. Führen Sie Ihre Agenten einen oder zwei Tage normal aus.
tight simulieren — führen Sie GET /api/workspace/firewall/simulate?level=tight aus und vergleichen Sie, was verweigert würde, mit dem, was Sie im Events-Feed gesehen haben. Wenn destruktive Shell-Aufrufe oder SSRF-ähnliche ausgehende Requests Teil Ihres normalen Traffics sind, beheben Sie diese zuerst im Agenten.
Events und Matches beobachten — Firewall → Events zeigt jedes Tool-Call-Verdikt; Guardrails → Matches zeigt Content-Policy-Treffer. Beide sind nach Verdikt, Tool, Lauf und Session filterbar.
tight anwenden — sobald die Simulate-Ausgabe keine Überraschungen enthält, wenden Sie tight an. Undo ist ein Aufruf entfernt, wenn etwas in Produktion bricht.
Mit Regeln abstimmen — verwenden Sie Firewall-Regeln, um Ausnahmen zu schnitzen oder Kontrollen hinzuzufügen, die die Preset-Level nicht abdecken. Das Autonomie-Level ist Ihr Boden; benutzerdefinierte Regeln fügen Präzision hinzu.

4. Rollenanforderungen

Aktion	Mindestrolle
Ein Level simulieren (`GET .../simulate`)	Member
Den Audit-Trail lesen	Member
Guardrail-Matches anzeigen	Member
Firewall-Events & Runs anzeigen	Developer+
Ein Autonomie-Level anwenden	Developer+
Eine Autonomie-Änderung rückgängig machen	Developer+

5. Was das nicht ist

Keine Black Box. Das Anwenden eines Autonomie-Levels schreibt eine echte Firewall-Policy und ein Guardrail (benannt nach dem Level) und macht sie zur Live-Haltung Ihres Workspaces. Sie können sie danach öffnen, inspizieren und bearbeiten — es ist ein schneller Ausgangspunkt, kein gesperrtes Preset.
Reversibel, mit Einschränkungen. Ein-Klick-Undo stellt den vorherigen Firewall- und Guardrails-Zustand aus einem Audit-Snapshot wieder her. Für einen sehr großen Workspace, dessen Snapshot die Audit-Log-Größenbeschränkung überschreitet, gelingt das Anwenden trotzdem, aber Undo ist für diese Änderung nicht verfügbar — Sie wenden dann das gewünschte Level erneut an. Selten, aber wissenswert.
Kein Ersatz für Scoped Keys. Die Autonomie-Kontrolle setzt die Standard-Haltung des Workspaces. Individuelle API-Keys können trotzdem an spezifische Policies für feinere Kontrolle gebunden werden. Siehe Guardrails vs. Firewall für das Zusammenwirken der Ebenen.

Die Autonomie-Kontrolle ist für die ersten 30 Minuten ausgelegt — schnell geschützt, echtes Verhalten Ihrer Agenten verstehen, dann aus einer Position der Sichtbarkeit verschärfen, nicht aus Rätselraten.

Quickstart

Vollständiges Zero-Trust-Setup in 5 Minuten, einschließlich Scoped Keys und Guardrails.

Firewall

Regeldetails — Verdikte, Surfaces, Argument-Prädikate und HITL-Freigabe.

​1. Was die Autonomie-Kontrolle tut

​2. Wie ein Level angewendet wird

​3. Der empfohlene Pfad

​4. Rollenanforderungen

​5. Was das nicht ist

Quickstart

Firewall

1. Was die Autonomie-Kontrolle tut

2. Wie ein Level angewendet wird

3. Der empfohlene Pfad

4. Rollenanforderungen

5. Was das nicht ist