Die Firewall sieht Egress nur für Ziele, die über das Gateway geroutet
werden via den MCP-Dispatch-Pfad oder den Evaluate-Hook. Ein Tool, das Ihr
Agent vollständig innerhalb seines eigenen Prozesses ausführt, liegt außerhalb
seiner Sicht. Routen Sie die netzwerkgebundenen Tool-Calls Ihres Agenten durch
das Gateway, und sie werden gesteuert.
1. Wie der Angriff funktioniert
Der kanonische Pfad durch einen Agenten läuft in drei Schritten:- Injection — der Agent liest nicht vertrauenswürdige Inhalte mit eingebetteten Anweisungen (eine Webseite, ein abgerufenes Dokument, eine CRM-Notiz).
- Sammlung — die injizierten Anweisungen sagen dem Agenten, sensibles Material zu sammeln — API-Keys, Datenbankzeilen, Benutzer-PII — mit Tools, die er bereits besitzt.
- Exfiltration — dem Agenten wird gesagt, dieses Material über ein
fetch-förmiges Tool zu senden:
http_fetch,web_search,fetch_urloderrequest. Das Ziel ist angreiferkontrolliert.
169.254.169.254 (Cloud-Metadaten), einen internen
Redis-Port oder einen anderen privaten Dienst gelenkt. Siehe
Prompt-Injection für den
Injektionsschritt; diese Seite konzentriert sich auf den Netzwerkschritt.
2. Egress-Allowlist — ausgehende Ziele sperren
Die dauerhafteste Verteidigung ist eine Egress-Allowlist: zählen Sie die Hosts auf, die Ihre Agenten legitim erreichen dürfen, und verweigern alles andere. Eine Egress-Regel verwendetstage: egress und das egress-Feld. Das Verdikt
steuert die Polarität — allow lässt gelistete Ziele durch; ein
niederprioritäter deny-Catch-All blockiert den Rest:
169.254.169.254, das von DNS zurückgegeben
wird, trotzdem von einem 10.0.0.0/8-CIDR-Deny-Eintrag abgefangen wird. Ein
blockierter Aufruf gibt HTTP 400 mit dem Fehlercode firewall_blocked zurück.
Um bekannte böse Bereiche ohne explizite Allowlist zu verweigern, schreiben Sie
eine gezielte Egress-Deny-Regel, die den Cloud-Metadaten-Endpunkt
(169.254.169.254) und die RFC-1918-Privatbereiche (10.0.0.0/8,
172.16.0.0/12, 192.168.0.0/16) auflistet. Schichten Sie Ihre Allowlist
obendrauf bei einer niedrigeren Prioritätsnummer, sodass die Deny-Regeln zuerst
ausgewertet werden.
3. Fetch-förmige Tools auf der Namensebene blockieren
Bevor ein Egress-Ziel überhaupt ausgewertet wird, können Sie die Fähigkeit vollständig entfernen. Dastight-Autonomie-Level verweigert http_fetch,
web_search, fetch_url und request durch Tool-Name-Glob als SSRF- und
Exfiltrations-Backstop. Wenn Ihr Agent keines dieser Tools benötigt, entfernt
tight die Angriffsfläche in einem Schritt:
tight-Haltung zu verweigern,
schreiben Sie eine inbound-Surface-Deny-Regel. inbound blockiert das Tool
bevor das Modell es wählen kann — der Agent empfängt die Fähigkeit nie in
seiner Tool-Liste:
4. Secrets-Blocker-Guardrail — Credentials auf dem Prompt stoppen
Das Secrets-Blocker-Guardrail läuft auf der Input-Stage und scannt den Prompt auf AWS-ähnliche Access-Keys, OpenAI-Keys, Anthropic-Keys, GitHub-Tokens und ähnliche Credential-Muster, bevor der Request das Gateway verlässt. Wenn ein Secret erkannt wird, wird der Request blockiert — die Credential erreicht nie ein Modell und erscheint nie in einem Tool-Call. Aktivieren Sie es vom Guardrails-Panel, oder als Teil destight-Autonomie-
Levels. Es ist unabhängig von den Firewall-Egress-Regeln.
| Bedrohung | Ebene, die sie stoppt |
|---|---|
| Prompt trägt einen API-Key | Secrets-Blocker (Input-Guardrail) |
| Agent ruft ein fetch-Tool auf ein Angreifer-Host auf | Egress-Allow/Deny-Regel |
| Fetch-förmiges Tool dem Modell angeboten | Inbound-Deny-Regel oder tight-Autonomie |
| Agent erreicht Cloud-Metadaten oder RFC-1918 | Egress-Deny-Regel, die diese CIDRs auflistet |
5. Mit Shadow-Mode ausrollen
Wenn Sie nicht sicher sind, welche Hosts Ihr Agent heute legitim erreicht, starten Sie im Shadow-Mode, bevor Sie durchsetzen:- Erstellen Sie die Egress-Regeln mit Ihrer beabsichtigten Allowlist und
setzen Sie
shadow_mode: trueauf der Policy. - Beobachten Sie den Events-Feed — Aufrufe, die blockiert worden wären,
erscheinen als
[shadow] would denymit dem Ziel. - Passen Sie die
allow-Liste an, bis nur angreifererreichbare Ziele verweigert würden, dann deaktivieren Sie Shadow-Mode, um mit der Durchsetzung zu beginnen.
6. Weiterführende Themen
Firewall-Regeln-Referenz
Vollständige Matching-Sprache — Egress-Listen, CIDRs, Argument-Klauseln
und alle Verdikte.
Agent-Firewall-Übersicht
Policies, Surfaces, Autonomie-Level und Observability.
Prompt-Injection
Der Injektionsschritt, der Agenten zur Exfiltration lenkt.
MCP-Tool-Poisoning
Bösartige MCP-Tools, die fetch-förmige Fähigkeiten registrieren.
