ai supply chain security ; les références
Firewall et Skills
portent les mécanismes complets.
1. Sécurité de la chaîne d’approvisionnement ia pour les agents, à la passerelle
Le point d’étranglement est le chemin de relais. Que la capacité ait été enregistrée à la main, auto-installée par l’agent, ou tirée d’un registre communautaire, son premier appel d’outil franchitapi.orcarouter.ai — et
c’est là que le Firewall l’évalue. Quatre contrôles se composent en une seule
posture :
Passerelle MCP, éval par appel
Chaque
tools/call est évalué contre votre politique avant le dispatch —
le manifeste n’est jamais la source de vérité.Bandes de risque & quarantaine des skills
Les capacités installées sont scannées, scorées, et mises en attente de
revue jusqu’à ce qu’un humain les approuve.
Identifiants MCP chiffrés
Les secrets d’auth de serveur sont chiffrés au repos et injectés au
dispatch — jamais exposés au modèle, à l’agent, ou aux arguments d’appel.
Listes blanches d'egress
Épinglez où les appels d’outils peuvent envoyer des données, de sorte
qu’une dépendance compromise ne puisse pas exfiltrer vers un hôte que vous
n’avez jamais approuvé.
La détection est à la passerelle, à la première utilisation — pas dans votre
gestionnaire de paquets ni votre système de fichiers. C’est délibéré : c’est
l’unique chemin qui voit chaque agent et chaque appel d’outil peu importe
comment la capacité est arrivée là.
2. La menace : une dépendance qui grandit après que vous lui faites confiance
| Vecteur | Ce qui se passe |
|---|---|
| Rug-pull | Un serveur MCP enregistré ajoute un outil (shell.exec, un nouveau fetch) que vous n’avez jamais approuvé. |
| Skill creep | Un skill installé utilise des outils ou des hôtes que son manifeste n’a jamais déclarés. |
| Vol d’identifiant | L’implémentation d’outil d’un serveur compromis lit son propre secret d’auth pour téléphoner à la maison. |
| Exfiltration par egress | Une chaîne récupérer→envoyer expédie vos données vers un hôte contrôlé par l’attaquant. |
3. Un exemple concret — enregistrer et épingler un serveur MCP
Vous enregistrez un serveur MCP tiers depuis la console (Settings → Firewall → MCP servers ; les écritures nécessitent Developer+). Le secret d’auth du serveur est stocké chiffré — vous le fournissez une fois, la passerelle l’injecte au dispatch, et il est masqué à chaque lecture après cela. Un enregistrement de serveur MCP porte :| Champ | Valeurs |
|---|---|
auth_mode | none, bearer, oauth, basic |
status | ok, degraded, down (défini par la sonde de santé) |
credentials | chiffrés au repos, jamais renvoyés en clair |
/api/workspace/firewall/*) qui nécessite Developer+, pas une clé de
relais — enregistrement, sonde, et rédaction de règles se produisent tous sur
le plan de gestion :
tool_name_glob: <server>.* à
pending_approval jusqu’à ce que vous ayez vu un historique d’appels propre —
chaque appel de ce serveur est mis en attente pour un humain avant de
s’exécuter. Une fois que vous lui faites confiance, relâchez la règle vers
audit ou allow. À partir de ce point, la passerelle MCP évalue chaque
tools/call sur la surface mcp avant le dispatch — de sorte que si un
rug-pull ajoute plus tard un outil non déclaré, c’est votre politique, pas le
manifeste du serveur, qui décide s’il s’exécute.
4. Bandes de risque & quarantaine des skills
Chaque capacité installable — que vous l’ayez enregistrée ou que la passerelle l’ait auto-détectée à l’exécution — est passée à travers le scanner de skills. Les constatations remontent à une bande de risque et à un mode d’application :Bandes de risque
Bandes de risque
low · medium · high · critical. La bande est dérivée de passes de
scanner déterministes sur le manifeste et les scopes déclarés (utilisation
d’outil non déclarée, egress réseau hors des scopes approuvés, écritures de
système de fichiers non sûres, texte de manifeste en forme d’injection).Modes d'application
Modes d'application
allow (vos règles de politique décident), quarantine (tout verdict
non-deny escalade en pending_approval — un humain approuve chaque appel),
block (force deny sur tous les outils de ce skill peu importe les
règles). Un skill de bande high se met en quarantaine automatiquement ;
critical bloque.Pourquoi auto-détecté = toujours en quarantaine
Pourquoi auto-détecté = toujours en quarantaine
Une capacité qu’un agent s’auto-installe, ou un outil qu’un rug-pull
ajoute, est mise en attente
pending_approval peu importe son score de
scan jusqu’à ce qu’un humain la relise. Un opérateur ne peut pas ajouter
discrètement un outil et faire en sorte que vos agents commencent à
l’utiliser.5. Listes blanches d’egress — contenir le « téléphone à la maison »
Le résultat de chaîne d’approvisionnement le plus dommageable est une dépendance compromise qui exfiltre. La surfaceegress du Firewall évalue la
destination sortante (host / IP / CIDR) qu’un outil rapporte, de sorte que
vous pouvez épingler où les données sont autorisées à aller.
Vous rédigez une règle d’egress vous-même : une liste blanche host/CIDR
avec un prédicat cidr_match refuse tout ce qui est hors-liste. Combinez-la
avec une règle de séquence qui brise la chaîne récupérer→egress, et un
outil empoisonné qui essaie d’expédier un document récupéré vers un hôte
inconnu est refusé à la passerelle.
6. Identifiants chiffrés — un serveur compromis ne peut pas lire vos clés
Les secrets d’auth de serveur sont chiffrés au repos et injectés par la passerelle au moment du dispatch. Ils n’atteignent jamais le modèle, l’agent, ou les arguments d’appel d’outil — de sorte qu’un serveur compromis ou malveillant ne puisse pas exfiltrer vos clés API en lisant son propre blob d’identifiant. La console renvoie toujours le secret masqué — même à un Admin. La valeur déchiffrée est remise sur exactement un chemin : une requête portant un token scopé à la passerelle firewall (un type de token dédié qu’un Admin frappe explicitement pour la passerelle/proxy), de sorte qu’une clé de relais ordinaire fuitée ne puisse pas énumérer vos identifiants MCP.7. Le condenser pour un audit
La gouvernance de chaîne d’approvisionnement est aussi un artefact d’audit. OrcaRouter s’aligne sur l’OWASP Top 10 for LLM Applications — y compris le contrôle LLM05 Supply Chain — dans le cadre du moteur de conformité, aux côtés de frameworks commesoc2, iso_27001, iso_42001, nist_ai_rmf, et
l’eu_ai_act.
Installer un compliance pack
(POST /api/compliance/packs/:key/install, Admin d’espace de travail,
plan payant) matérialise les guardrails et politiques firewall correspondants
et démarre dans une posture observe-first. Les rapports de conformité incluent
une section AI-supply-chain evidence — les fournisseurs amont vers
lesquels votre espace de travail a réellement routé, plus une revue d’accès
privilégié et d’hygiène des clés — et sont signés Ed25519 et publiquement
vérifiables. Parcourir le catalogue et la préparation est gratuit pour tout
Member ; voir Conformité pour le cycle
de vie complet.
La gouvernance MCP est deux couches complémentaires : évaluation firewall par
appel sur la surface
mcp (application sur ce qu’une dépendance fait),
plus une baseline d’intégrité de schéma d’outils (hash trust-on-first-use
de l’ensemble d’outils annoncé, re-vérifié à chaque sonde — la dérive bascule
le schema_status du serveur à changed et fait échouer le dispatch en mode
closed jusqu’à ce qu’un admin re-baseline ou mette en quarantaine). Avec les
bandes de risque et la quarantaine des skills, c’est une application sur à la
fois ce qu’une dépendance fait et un enregistrement vérifiable de ce qu’elle a
déclaré.8. Une baseline de chaîne d’approvisionnement
Avant de faire confiance à un nouveau serveur MCP ou skill
Avant de faire confiance à un nouveau serveur MCP ou skill
Enregistrez-le, sondez son ensemble d’outils, et scopez une règle
<server>.* à pending_approval ou audit. Lisez les constatations du
scan — toute constatation d’outil non déclaré ou d’egress externe est une
raison de le garder en quarantaine. Vérifiez qui contrôle l’URL de
l’endpoint.En régime permanent
En régime permanent
Gardez une liste blanche d’egress épinglée pour tout agent avec des outils
de fetch/search/export. Surveillez la vue
Discovered tools pour les capacités apparues sans
règle, et le flux d’anomalies pour les chemins d’outil à outil nouveaux.
Après un rug-pull suspecté
Après un rug-pull suspecté
Désactivez le serveur (
PUT .../mcp_servers, "enabled": false) — ses
identifiants ne sont jamais déchiffrés tant qu’il est désactivé.
Re-sondez pour faire surface les nouveaux outils, re-scannez le skill, et
relisez la file pending_approval plutôt que d’approuver en masse.9. Menaces & concepts liés
- Empoisonnement d’outils MCP & rug-pulls — l’approfondissement sur les serveurs MCP malveillants et détournés.
- Exfiltration de données — règles d’egress qui restreignent où les appels d’outils peuvent envoyer des données.
- Appels d’outils dangereux — bloquer les actions destructrices peu importe d’où l’outil vient.
- Fuite de secrets — garder les identifiants hors des prompts, des arguments, et des journaux.
- Sécuriser les agents IA et la pile de contrôle — comment ces contrôles s’inscrivent dans la posture plus large.
Firewall : Serveurs MCP
Enregistrez les serveurs MCP derrière la passerelle, sondez leurs outils,
et appliquez un verdict par appel avant qu’aucun appel n’atteigne le vrai
serveur.
Firewall : Skills
Scannez et scorez le risque de chaque capacité installable. Mettez en
quarantaine ou bloquez les skills risqués avant que leurs outils ne
s’exécutent.
