owasp_llm) — pas seulement une
vue de checklist. L’installer matérialise les règles de guardrail et la
politique firewall auxquelles chaque risque correspond, sur le même chemin que
chaque requête vers api.orcarouter.ai franchit déjà, et capture ce qui a été
attrapé dans un rapport signé que vous pouvez remettre à un auditeur.
Cette page fait correspondre chaque risque OWASP LLM couvert au contrôle
OrcaRouter qui l’applique, montre comment installer le pack, et renvoie vers
la référence approfondie pour chaque contrôle. Pour l’arc installer-et-passer-en-production
à travers tous les frameworks, commencez par la
Vue d’ensemble de la conformité.
1. L’OWASP LLM Top 10 mis en correspondance avec les contrôles OrcaRouter
Le packowasp_llm est une correspondance de contrôles qui s’installe comme
une politique réelle — chaque entrée ci-dessous est un contrôle que la
passerelle applique, pas une description d’intention. Les risques à fort
signal correspondent à des guardrails vivants et une politique firewall ; un
risque (LLM05) est un contrôle organisationnel sans surface d’application de
passerelle.
LLM01 — Injection de prompt
LLM01 — Injection de prompt
Un Guardrail sur l’entrée de la requête. Le pack combine le preset de
sécurité Prompt-Injection Basics (signalement par mots-clés) avec une
règle regex de jailbreak (modes DAN/STAN/AIM plus le smuggling de texte
caché par tag-byte Unicode) pour attraper les tentatives d’injection
directes et obscurcies. Associez-le à une règle
llm_judge pour
l’intention d’injection sémantique. Voir
Injection de prompt et
Jailbreaks.LLM02 — Gestion non sûre des sorties
LLM02 — Gestion non sûre des sorties
Un Guardrail sur le stage de sortie qui bloque les réponses du modèle
contenant des charges d’injection SQL classiques (
UNION SELECT, OR 1=1, DROP TABLE) avant qu’elles n’atteignent un système en aval qui
pourrait les auto-exécuter. Passez en revue les correspondances dans le
flux de correspondances des Guardrails.LLM05 — Chaîne d'approvisionnement
LLM05 — Chaîne d'approvisionnement
Un contrôle organisationnel — l’assurance de la chaîne
d’approvisionnement pour vos modèles, données et dépendances est un
processus que vous possédez, pas une vérification de passerelle au moment
de la requête. Le pack le porte comme preuve dans le rapport de sorte que
votre auditeur le voie pris en compte. Pour le côté runtime des outils
tiers, voir
Sécuriser les agents IA.
LLM06 — Divulgation d'informations sensibles
LLM06 — Divulgation d'informations sensibles
Deux Guardrails : le Secrets & API-Key Blocker (rejette les requêtes
portant des références d’identification AWS / OpenAI / GitHub) et un PII
Blocker strict (rejette les requêtes portant des emails, numéros de
téléphone, SSN, cartes de crédit ou IPs). Les deux rejettent en dur sur la
requête avant qu’elle n’atteigne le fournisseur. Voir les sections PII et
secrets de Guardrails.
LLM07 — Fuite du prompt système
LLM07 — Fuite du prompt système
Un Guardrail sur le stage de sortie qui bloque les réponses du modèle
renvoyant en écho des tokens de contrôle de chat-template (
<|system|>,
<|im_start|>) — preuve claire que le prompt système est en train de
fuir. Ajustez la règle et passez en revue ses déclenchements dans le flux
de correspondances.LLM08 — Agence excessive
LLM08 — Agence excessive
Une règle de politique Firewall qui refuse les appels d’outils de
classe shell / exec dangereux — le contrôle du plan d’action. C’est là que
le firewall, pas un guardrail de contenu, fait le travail : il évalue les
appels d’outils que votre modèle émet. Voir
Appels d’outils dangereux et
Agence excessive.
Le pack couvre le sous-ensemble à fort signal de la liste OWASP qui a une
surface d’application de passerelle concrète — LLM01, LLM02, LLM06, LLM07,
LLM08 comme contrôles appliqués, plus LLM05 comme preuve organisationnelle.
Les risques qui vivent entièrement dans le code de votre propre application
(vol de modèle, empoisonnement des données d’entraînement) sont hors du chemin
de la passerelle et restent les vôtres à traiter — voir
Responsabilité partagée.
2. Pourquoi guardrails et firewall, pas un seul contrôle
La liste OWASP LLM s’étend sur deux plans différents, et OrcaRouter sépare ses contrôles le long de la même ligne :| Plan | Couvre | Contrôle |
|---|---|---|
| Contenu | LLM01, LLM02, LLM06, LLM07 | Guardrails |
| Action | LLM08 | Firewall |
3. Installer le pack
Parcourir le catalogue et la readiness est gratuit pour tout Member de l’espace de travail. Installer le pack matérialise les guardrails et la politique firewall, et est une action d’Admin de l’espace de travail gardée derrière un plan payant. Faites-le depuis la console — Compliance → Catalog → OWASP LLM Top-10 → Install. L’installation crée des règles de guardrail et une politique firewall réelles et éditables dans votre espace de travail. Elles sont les vôtres à ajuster ensuite — ajustez la liste d’entités PII, échangez le deny LLM08 pour un verdictaudit pendant que vous apprenez le comportement de vos agents, ou
ajoutez une règle d’injection llm_judge par-dessus la base mots-clés/regex
de LLM01. Attachez le guardrail à une clé via guardrail_id et la politique
firewall via firewall_policy_id, ou définissez l’un ou l’autre comme défaut
de l’espace de travail.
4. Prouvez-le avec un rapport signé
Une couverture que vous ne pouvez pas montrer n’est pas une couverture. Après que le pack tourne, générez un rapport de conformité — il est signé Ed25519 et estampillé SHA256, exportable en CSV / JSON / PDF, et publiquement vérifiable sans compte OrcaRouter.Générer un rapport signé
Ce que le rapport capture et comment il est signé.
Vérifier un rapport
Remettez à un auditeur l’endpoint de vérification public — aucun compte
nécessaire.
5. Où aller ensuite
Vue d'ensemble de la conformité
L’arc complet installer → appliquer → rapport → passage en production.
Ce qu'il y a dans un pack
Comment les contrôles d’un pack deviennent des guardrails et une politique
firewall.
Tous les frameworks
Les autres packs IA, sécurité et confidentialité du catalogue.
Sécuriser les agents IA
Le référentiel qui durcit les agents contre ces risques de bout en bout.
