Redacter la PII avec PII Shield

Vous voulez garder les données personnelles hors du modèle en amont. Un client colle une adresse email, un transcript de support transporte un numéro de carte, un prompt d’agent fait fuiter un SSN — et rien de cela ne devrait atteindre OpenAI, Anthropic ou Google en clair. PII Shield est le moyen le plus rapide de corriger ça : un preset de guardrail à une règle qui détecte les entités sensibles dans la requête et masque chacune en une balise typée avant que la passerelle ne transmette l’appel. C’est une page d’atterrissage ciblée sur le cas d’usage du masquage de PII. Pour le moteur de guardrail complet — chaque type de règle, champ et route — voir la référence Guardrails.

1. Cas d’usage de redaction PII LLM en une règle

La partie difficile de la plomberie pii redaction llm est généralement la plomberie. PII Shield la supprime. Le preset est une seule règle pii :

Type : PII detection (pii)
Action : Mask — remplacer chaque correspondance par une balise typée
Entités : email, phone, ssn, credit_card, ip

Appliquez-la une fois dans la console, attachez-la à une clé, et chaque appel sur cette clé est filtré sans changement de SDK et sans redéploiement. La politique vit dans la passerelle, pas votre application — votre application continue d’appeler /v1/chat/completions exactement comme avant.

Le masquage à l’étape input est le chemin actif. PII Shield masque la requête avant qu’elle ne quitte la passerelle, donc le modèle en amont ne voit jamais la valeur originale. Le masquage actif de la sortie du modèle et des réponses streamées est sur la feuille de route ; cadrez PII Shield comme le nettoyage de ce que vous envoyez, pas de ce qui revient. Pour contrôler les réponses du modèle aujourd’hui, une règle block de sortie est appliquée dans les deux cas — voir Règles à l’étape output et Couverture du streaming.

2. Appliquer le preset dans la console

Chaque étape ici est une action de console sur la passerelle hébergée sous votre propre session. Créer et modifier des guardrails nécessite Developer+ dans l’espace de travail. Seul l’appel /v1/* final utilise une clé de relais sk-orca-....

Ouvrir le template

Dans la console, ouvrez Guardrails, cliquez sur le split-button New guardrail, et choisissez PII Shield dans la catégorie de templates PII. Il sème une seule règle pii de masquage.

Nommer et enregistrer

Donnez-lui un nom (≤ 64 caractères), par exemple pii-shield, et enregistrez. Un preset est une graine, pas un verrou — modifiez librement la liste d’entités ou l’action ensuite.

Le tester

Ouvrez l’onglet Test, collez un échantillon à l’étape input, et exécutez la politique localement — aucun appel en amont, aucun quota (voir §4).

Attacher une clé

Modifiez une clé API et choisissez pii-shield dans la liste déroulante Guardrail (définit guardrail_id sur la clé), ou marquez-le comme défaut de l’espace de travail. Voir Attacher à une clé et Défaut de compte.

3. Ce qui est masqué, et en quoi

Sur une action mask, chaque correspondance est remplacée par une balise typée — un email devient [EMAIL], un SSN devient [SSN]. L’ensemble de détecteurs intégrés est fermé et partagé par le moteur, le sandbox et le constructeur de règles :

Entités intégrées

email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.

Identifiants régionaux

jp_mynumber (My Number du Japon → [JP_MYNUMBER]), kr_rrn (RRN de Corée → [KR_RRN]), et cn_resident_id (carte de résident de Chine → [CN_RESIDENT_ID]). Activez ceux qui correspondent à votre juridiction.

Vos propres entités personnalisées

Superposez un détecteur regex par-dessus les détecteurs intégrés — un employee_id, un numéro de compte interne — avec un checksum luhn optionnel et un remplacement personnalisé. Jusqu’à 25 par règle. Voir Entités PII personnalisées et Formats de masquage.

Une règle PII peut appliquer différentes actions à différentes entités via entity_actions — masquer email / phone / ip, mais block sur credit_card ou ssn. Pas besoin de règles qui se chevauchent. Voir Actions.

4. Tester avant d’attacher

Prouvez que la règle fait ce que vous attendez avant qu’une clé ne pointe vers elle. Ouvrez l’onglet Test à l’intérieur de l’éditeur, collez un échantillon, choisissez l’étape input, et lancez :

Reply to jane@acme.com please

Le sandbox évalue la politique actuelle localement et renvoie le verdict plus le texte rendu — rien n’est envoyé en amont, rien n’est mesuré :

Reply to [EMAIL] please

Pour une grille A/B contre un corpus, le harnais d’évaluation vit dans l’onglet d’à côté.

5. Envoyer une requête

En utilisant une clé liée à pii-shield, appelez OrcaRouter exactement comme avant — aucun nouvel en-tête, aucun changement de SDK :

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

La passerelle masque l’email en [EMAIL] avant la transmission — le modèle en amont reçoit Reply to [EMAIL] please et ne voit jamais l’adresse.

Basculez l’action d’une entité sur block (via un override par entité) et la toute prochaine requête transportant cette entité est rejetée avec une HTTP 400 guardrail_blocked. Une requête bloquée ne coûte aucun quota (un block d’entrée se déclenche avant la mesure) et est marquée skip-retry. Voir l’erreur guardrail_blocked.

6. Voir ce qui s’est déclenché

Chaque règle qui se déclenche enregistre une correspondance — type de règle, action, étape et une chaîne de détail — qui apparaît dans le flux Matches de l’espace de travail. La sous-chaîne correspondante elle-même (l’adresse email réelle) n’est enregistrée que lorsque Log raw content est activé, ce qui est désactivé par défaut — la posture conservatrice en matière de confidentialité qui garde aussi la PII redactée hors de votre propre télémétrie.

Pour un contrôle de redaction, laisser Log raw content désactivé est généralement le but : vous pouvez voir *qu’*un email a été masqué et à quelle fréquence, sans re-capturer la valeur que vous venez de nettoyer. Activez-le par guardrail uniquement quand vous avez besoin de la sous-chaîne pour le triage ; le réglage n’est pas rétroactif. Voir Flux des correspondances et Journalisation & confidentialité.

7. Où aller ensuite

Entités PII personnalisées

Ajoutez vos propres détecteurs regex avec des vérifications Luhn optionnelles, jusqu’à 25 par règle.

Formats de masquage

Contrôlez la balise typée vers laquelle chaque entité est rendue.

Bloquer les secrets

Attrapez les clés API et credentials avec le preset Secrets Blocker.

Ajuster les faux positifs

Marquez les faux positifs et resserrez les détecteurs depuis le flux Matches.

PII Shield masque le contenu. Pour gouverner les appels d’outils d’un agent — refuser les actions destructrices, redacter les arguments d’appels d’outils, exiger une approbation — utilisez le Firewall. Commencez par Sécuriser les agents IA et la menace d’exfiltration de données, ou lisez la référence Guardrails pour le moteur complet.

​1. Cas d’usage de redaction PII LLM en une règle

​2. Appliquer le preset dans la console

​3. Ce qui est masqué, et en quoi

​4. Tester avant d’attacher

​5. Envoyer une requête

​6. Voir ce qui s’est déclenché

​7. Où aller ensuite

Entités PII personnalisées

Formats de masquage

Bloquer les secrets

Ajuster les faux positifs

1. Cas d’usage de redaction PII LLM en une règle

2. Appliquer le preset dans la console

3. Ce qui est masqué, et en quoi

4. Tester avant d’attacher

5. Envoyer une requête

6. Voir ce qui s’est déclenché

7. Où aller ensuite