ai supply chain security; die Firewall- und
Skills-Referenzen tragen die vollständige
Mechanik.
1. KI-Supply-Chain-Sicherheit für Agenten, am Gateway
Der Engpass ist der Relay-Pfad. Ob eine Fähigkeit von Hand registriert, vom Agenten auto-installiert oder aus einer Community-Registry gezogen wurde — ihr erster Tool-Call überquertapi.orcarouter.ai — und dort wertet die Firewall
sie aus. Vier Kontrollen komponieren zu einer einzigen Haltung:
MCP-Gateway, Pro-Aufruf-Eval
Jeder
tools/call wird vor dem Dispatch gegen Ihre Policy ausgewertet —
das Manifest ist nie die Quelle der Wahrheit.Skill-Risikobänder & Quarantäne
Installierte Fähigkeiten werden gescannt, bewertet und zur Überprüfung
zurückgehalten, bis ein Mensch sie genehmigt.
Verschlüsselte MCP-Anmeldedaten
Server-Auth-Secrets sind im Ruhezustand verschlüsselt und werden beim
Dispatch injiziert — nie dem Modell, dem Agenten oder den Aufruf-Argumenten
ausgesetzt.
Egress-Allow-Lists
Pinnen Sie, wohin Tool-Calls Daten senden dürfen, sodass eine
kompromittierte Abhängigkeit nicht zu einem Host exfiltrieren kann, den Sie
nie genehmigt haben.
Die Erkennung erfolgt am Gateway, bei der ersten Nutzung — nicht in Ihrem
Paketmanager oder Dateisystem. Das ist beabsichtigt: Es ist der eine Pfad, der
jeden Agenten und jeden Tool-Call sieht, ganz gleich, wie die Fähigkeit
dorthin gelangt ist.
2. Die Bedrohung: eine Abhängigkeit, die wächst, nachdem Sie ihr vertrauen
| Vektor | Was passiert |
|---|---|
| Rug-Pull | Ein registrierter MCP-Server fügt ein Tool (shell.exec, ein neues fetch) hinzu, das Sie nie genehmigt haben. |
| Skill-Creep | Ein installierter Skill verwendet Tools oder Hosts, die sein Manifest nie deklariert hat. |
| Anmeldedaten-Diebstahl | Die Tool-Implementierung eines kompromittierten Servers liest ihr eigenes Auth-Secret, um nach Hause zu telefonieren. |
| Egress-Exfiltration | Eine retrieve→send-Kette verschickt Ihre Daten an einen angreifer-kontrollierten Host. |
3. Ein konkretes Beispiel — einen MCP-Server registrieren und pinnen
Sie registrieren einen Drittanbieter-MCP-Server aus der Konsole (Settings → Firewall → MCP servers; Schreibvorgänge benötigen Developer+). Das Auth-Secret des Servers wird verschlüsselt gespeichert — Sie liefern es einmal, das Gateway injiziert es beim Dispatch, und es ist bei jedem Lesen danach maskiert. Ein MCP-Server-Datensatz trägt:| Feld | Werte |
|---|---|
auth_mode | none, bearer, oauth, basic |
status | ok, degraded, down (durch die Health-Probe gesetzt) |
credentials | im Ruhezustand verschlüsselt, nie im Klartext zurückgegeben |
/api/workspace/firewall/*), die Developer+ benötigt, nicht einen
Relay-Key — Registrieren, Proben und Regel-Verfassen geschehen alle auf der
Management-Ebene:
tool_name_glob: <server>.* auf pending_approval, bis
Sie eine saubere Aufrufhistorie gesehen haben — jeder Aufruf von diesem Server
wird für einen Menschen zurückgehalten, bevor er läuft. Sobald Sie ihm
vertrauen, lockern Sie die Regel auf audit oder allow. Von da an
evaluiert das MCP-Gateway jeden tools/call auf der mcp-Surface vor dem
Dispatch — sodass, wenn ein Rug-Pull später ein undeklariertes Tool
hinzufügt, Ihre Policy, nicht das Manifest des Servers, entscheidet, ob es
läuft.
4. Skill-Risikobänder & Quarantäne
Jede installierbare Fähigkeit — ob Sie sie registriert haben oder das Gateway sie zur Laufzeit auto-detektiert hat — wird durch den Skill-Scanner geführt. Findings rollen zu einem Risikoband und einem Enforcement-Mode auf:Risikobänder
Risikobänder
low · medium · high · critical. Das Band wird aus
deterministischen Scanner-Durchläufen über das Manifest und die
deklarierten Scopes abgeleitet (undeklarierte Tool-Nutzung,
Netzwerk-Egress außerhalb genehmigter Scopes, unsichere
Dateisystem-Schreibvorgänge, injection-förmiger Manifest-Text).Enforcement-Modes
Enforcement-Modes
allow (Ihre Policy-Regeln entscheiden), quarantine (jedes
Nicht-deny-Verdikt eskaliert zu pending_approval — ein Mensch genehmigt
jeden Aufruf), block (deny auf allen Tools dieses Skills erzwingen,
unabhängig von Regeln). Ein high-Band-Skill quarantäniert automatisch;
critical blockiert.Warum auto-detektiert = immer quarantäniert
Warum auto-detektiert = immer quarantäniert
Eine Fähigkeit, die ein Agent selbst installiert, oder ein Tool, das ein
Rug-Pull hinzufügt, wird in
pending_approval zurückgehalten, unabhängig
von seinem Scan-Score, bis ein Mensch es überprüft. Ein Operator kann nicht
leise ein Tool hinzufügen und Ihre Agenten es nutzen lassen.5. Egress-Allow-Lists — das „nach Hause telefonieren” eindämmen
Das schädlichste Supply-Chain-Resultat ist eine kompromittierte Abhängigkeit, die exfiltriert. Dieegress-Surface der Firewall wertet das ausgehende Ziel
(Host / IP / CIDR) aus, das ein Tool meldet, sodass Sie pinnen können, wohin
Daten gehen dürfen.
Sie verfassen eine Egress-Regel selbst: eine Host/CIDR-Allow-List mit einem
cidr_match-Prädikat lehnt alles ab, was nicht auf der Liste steht.
Kombinieren Sie sie mit einer Sequenz-Regel, die die retrieve→egress-Kette
bricht, und ein vergiftetes Tool, das versucht, ein abgerufenes Dokument an
einen unbekannten Host zu verschicken, wird am Gateway abgelehnt.
6. Verschlüsselte Anmeldedaten — ein kompromittierter Server kann Ihre Keys nicht lesen
Server-Auth-Secrets sind im Ruhezustand verschlüsselt und werden vom Gateway zur Dispatch-Zeit injiziert. Sie erreichen nie das Modell, den Agenten oder die Tool-Call-Argumente — sodass ein kompromittierter oder bösartiger Server Ihre API-Keys nicht exfiltrieren kann, indem er seinen eigenen Anmeldedaten-Blob liest. Die Konsole gibt das Secret immer maskiert zurück — selbst einem Admin. Der entschlüsselte Wert wird auf genau einem Pfad ausgehändigt: einem Request, der einen firewall-gateway-scoped Token trägt (ein dedizierter Token-Typ, den ein Admin explizit für das Gateway/den Proxy prägt), sodass ein gewöhnlicher geleakter Relay-Key Ihre MCP-Anmeldedaten nicht aufzählen kann.7. Für ein Audit zusammenrollen
Supply-Chain-Governance ist auch ein Audit-Artefakt. OrcaRouter mappt auf die OWASP Top 10 for LLM Applications — einschließlich der LLM05 Supply Chain-Kontrolle — als Teil der Compliance-Engine, neben Frameworks wiesoc2, iso_27001, iso_42001, nist_ai_rmf und dem eu_ai_act.
Das Installieren eines Compliance-Packs
(POST /api/compliance/packs/:key/install, Workspace-Admin, kostenpflichtiger
Plan) materialisiert die passenden Guardrails und Firewall-Policies und startet
in einer Observe-first-Haltung. Compliance-Reports enthalten eine
AI-supply-chain-evidence-Sektion — die Upstream-Anbieter, zu denen Ihr
Workspace tatsächlich geroutet hat, plus eine Privileged-access- und
Key-hygiene-Überprüfung — und sind Ed25519-signiert und öffentlich
verifizierbar. Das Durchsuchen des Katalogs und der Readiness ist für jedes
Member kostenlos; siehe Compliance für
den vollständigen Lebenszyklus.
MCP-Governance besteht aus zwei komplementären Ebenen: Pro-Aufruf-Firewall-Auswertung
auf der
mcp-Surface (Durchsetzung dessen, was eine Abhängigkeit tut),
plus einer Tool-Schema-Integritäts-Baseline (Trust-on-first-use-Hash des
beworbenen Tool-Sets, bei jeder Probe neu geprüft — Drift kippt den
schema_status des Servers auf changed und failt den Dispatch closed, bis
ein Admin re-baselinet oder quarantäniert). Zusammen mit Skill-Risikobändern und
Quarantäne ist das Durchsetzung sowohl dessen, was eine Abhängigkeit tut, als
auch ein verifizierbarer Datensatz dessen, was sie deklariert hat.8. Eine Supply-Chain-Baseline
Bevor Sie einem neuen MCP-Server oder Skill vertrauen
Bevor Sie einem neuen MCP-Server oder Skill vertrauen
Registrieren Sie ihn, proben Sie sein Tool-Set und scopen Sie eine
<server>.*-Regel auf pending_approval oder audit. Lesen Sie die
Scan-Findings — jedes undeclared-tool- oder external-egress-Finding ist ein
Grund, ihn quarantäniert zu halten. Verifizieren Sie, wer die Endpunkt-URL
kontrolliert.Im eingeschwungenen Zustand
Im eingeschwungenen Zustand
Halten Sie eine Egress-Allow-List für jeden Agenten mit
Fetch/Search/Export-Tools gepinnt. Beobachten Sie die
Discovered-tools-Ansicht auf Fähigkeiten, die ohne
eine Regel auftauchten, und den Anomalie-Feed auf neuartige
Tool-zu-Tool-Pfade.
Nach einem vermuteten Rug-Pull
Nach einem vermuteten Rug-Pull
Deaktivieren Sie den Server (
PUT .../mcp_servers, "enabled": false) —
seine Anmeldedaten werden nie entschlüsselt, während er deaktiviert ist.
Re-proben Sie, um neue Tools sichtbar zu machen, rescannen Sie den Skill und
überprüfen Sie die pending_approval-Warteschlange, statt
massen-zu-genehmigen.9. Verwandte Bedrohungen & Konzepte
- MCP-Tool-Poisoning & Rug-Pulls — die Vertiefung zu bösartigen und gekaperten MCP-Servern.
- Datenexfiltration — Egress-Regeln, die beschränken, wohin Tool-Calls Daten senden dürfen.
- Gefährliche Tool-Calls — destruktive Aktionen blockieren, unabhängig davon, woher das Tool kam.
- Secret-Leakage — Anmeldedaten aus Prompts, Argumenten und Logs heraushalten.
- KI-Agenten absichern und der Control-Stack — wie diese Kontrollen in die breitere Haltung passen.
Firewall: MCP-Server
MCP-Server hinter dem Gateway registrieren, ihre Tools proben und ein
Pro-Aufruf-Verdikt anwenden, bevor ein Aufruf den echten Server erreicht.
Firewall: Skills
Jede installierbare Fähigkeit scannen und risikobewerten. Riskante Skills
quarantänieren oder blockieren, bevor ihre Tools laufen.
