La bibliothèque de templates de guardrail IA d’OrcaRouter : choisissez un preset dans la catégorie PII, secrets, compliance, brand, safety, cost ou agent, appliquez-le comme graine, puis modifiez chaque règle librement avant d’attacher une clé.
Vous voulez mettre une politique de contenu en place rapidement, sans écrire à la
main des regex ou des listes d’entités PII. La bibliothèque de templates est
le raccourci : un ensemble de presets de guardrail prêts à l’emploi, groupés par
cas d’usage, qui sèment chacun une politique fonctionnelle en un clic.
Choisissez-en un, nommez-le, et vous avez un ensemble de règles ordonnées complet
que vous pouvez attacher à une clé — ou modifier d’abord.C’est une page d’atterrissage ciblée sur le cas d’usage des presets. Pour le
moteur de guardrail complet — chaque type de règle, champ, action et route — voir
la référence Guardrails.
1. Ce que la bibliothèque de templates de guardrail IA vous donne
Un preset est un point de départ nommé qui dépose une Policy complète (une
ou plusieurs règles ordonnées) dans la modale de création. Les presets sont
rédigés côté serveur, donc le sélecteur de la console, le
sandbox Test et cette documentation
décrivent tous exactement le même comportement — il y a une seule source de
vérité.Chaque preset est une graine, pas un verrou. Une fois que vous en appliquez
un, vous possédez la copie : renommez-le, ajoutez ou supprimez des règles, changez
l’action ou l’étape
d’une règle, réglez à nouveau un détecteur. Rien dans le template original ne
contraint vos modifications.
Appliquer un preset, comme toute rédaction de guardrail, est une action de
console sous votre propre session d’espace de travail, et créer ou modifier
un guardrail nécessite Developer+ dans l’espace de travail. Seul l’appel de
relais /v1/* final utilise une clé sk-orca-....
Le sélecteur groupe les presets en huit catégories. Chacune se mappe sur un
contrôle courant que vous construiriez sinon à la main :
PII — redacter ou bloquer les données personnelles
Détectez et masquez (ou bloquez) les emails, téléphones, SSN, cartes, IPs et
plus. Commencez par PII Shield pour un
masquage à une règle, ou un bloqueur strict quand la PII ne doit jamais
atteindre le fournisseur.
Secrets — garder les credentials hors des prompts
Bloquez les clés AWS / OpenAI / GitHub, les clés privées PEM, les tokens cloud
et les adresses de portefeuille crypto avant qu’ils ne quittent la passerelle.
Voir Bloquer les secrets.
Compliance — rails de données réglementées
Blocs de cartes PCI, blocs d’identifiants UE/UK, blocs d’identifiants de
santé, et un
compliance logger en observation
seule qui enregistre les occurrences de PII sans changer le trafic.
Brand — listes de mots interdits et brand safety
Listes de mots interdits keyword pour les grossièretés, les mentions de
concurrents et les termes interdits spécifiques à une région — block ou mask.
Voir Brand safety et
Mots sensibles.
Safety — injection, jailbreak, automutilation
Rails keyword/regex pour les phrases d’injection de prompt, les motifs de
jailbreak / role-play, la détection de fuite de prompt système, et les listes
de mots interdits d’automutilation. Voir
Injection de prompt.
Cost — plafonds de taille et de longueur
Plafonds max_chars sur le prompt de la requête et la réponse du modèle pour
borner le coût et la latence. Voir
Cost guardrails.
Agent — filtres de contenu agentiques
Filtres d’URL, blocs d’image markdown (défense d’image-exfil), motifs de
shell-injection, et filtres de SQL-injection-en-sortie pour les flux d’agent.
Voir Guardrails agentiques.
Code security — secrets, licences, API risquées
Blocs d’affectation de fichiers .env / secrets, flags de licence copyleft
fort (GPL / AGPL / LGPL / SSPL) sur les requêtes et la sortie du modèle, et un
avis non-bloquant qui annote les prompts référençant des sinks à haut risque
(eval, os.system, pickle.loads). Voir
Sécurité du code.
Les presets ne sèment que les types de règles déterministes — keyword, regex,
PII et max-chars. Les types de règles avancés (fournisseur externe,
juge LLM, ancrage contextuel) sont ajoutés
depuis le constructeur de règles, pas depuis un template, parce qu’ils nécessitent
une connexion ou un modèle que vous choisissez.
Chaque étape ici est une action de console. La clé de relais n’apparaît que
dans la requête finale.
1
Ouvrir le sélecteur de templates
Dans la console, ouvrez Guardrails et cliquez sur le split-button New
guardrail. Le sélecteur s’ouvre groupé par les huit catégories ci-dessus.
2
Choisir un preset
Choisissez-en un — par exemple PII Shield dans la catégorie PII. Il
sème une politique complète (ici, une seule règle pii de masquage). Le
sélecteur affiche la description de chaque preset afin que vous sachiez ce
qu’il fait avant de l’appliquer.
3
Le nommer et modifier librement
Donnez-lui un nom (≤ 64 caractères). Les règles semées sont désormais les
vôtres — ajoutez, supprimez ou réglez n’importe laquelle. Un preset est une
graine, pas un verrou.
4
Tester avant d'attacher
Ouvrez l’onglet Test, collez un échantillon, choisissez une étape, et
exécutez la politique localement — aucun appel en amont, aucun quota. Prouvez
qu’elle fait ce que vous attendez avant qu’une clé ne pointe vers elle.
5
Attacher une clé
Modifiez une clé API et choisissez le guardrail dans la liste déroulante
Guardrail (définit guardrail_id sur la clé), ou marquez-le comme
défaut de l’espace de travail. Voir
Attacher à une clé et
Défaut de compte.
C’est une politique de masquage utilisable d’emblée. Mais parce que le preset est
une graine, vous pouvez immédiatement la resserrer — par exemple, basculer deux
entités sur block avec un override par entité afin que les cartes et SSN
soient rejetés carrément tandis que le reste est masqué :
La passerelle masque l’email en [EMAIL] avant la transmission. Une requête
transportant un numéro de carte est rejetée avec une HTTP 400guardrail_blocked — qui ne coûte aucun quota (un block d’entrée se
déclenche avant la mesure) et est marquée skip-retry. Voir l’erreur
guardrail_blocked.
Le preset PII Shield sème une règle de masquage à l’étape both, mais le
masquage actif de la sortie du modèle et des réponses streamées est sur la
feuille de route — le masquage à l’étape input est le chemin actif (la
passerelle nettoie la requête avant que le modèle ne la voie). Pour contrôler les
réponses du modèle aujourd’hui, une règle block de sortie est appliquée en
streaming comme en non-streaming. Voir
Règles à l’étape output et
Couverture du streaming.
Chaque création, mise à jour et suppression sur un guardrail — y compris le moment
où vous appliquez un preset et enregistrez — écrit une ligne d’historique
versionnée. Vous pouvez differ deux versions quelconques et revenir à une
plus ancienne, donc modifier une politique semée n’est jamais une porte à sens
unique. Voir Versioning.
Le preset de masquage de PII en un clic, du début à la fin.
Bloquer les secrets
Le preset Secrets Blocker — attrapez les clés et credentials dans la requête.
Guardrails agentiques
Filtres URL, image markdown, shell et SQL pour les flux d’agent.
Référence Guardrails
Le moteur complet — chaque type de règle, champ et route.
Les presets sèment des politiques de contenu. Pour gouverner les appels
d’outils d’un agent — refuser les actions destructrices, redacter les arguments
d’appels d’outils, exiger une approbation — commencez par le
Firewall et
Sécuriser les agents IA. Pour la façon
dont les deux couches se répartissent le travail, voir
Guardrails vs. Firewall.