Bloquer la fuite de secrets et de credentials

Un prompt qui transporte une clé AKIA..., un .env collé, un agent qui renvoie en écho son propre token sk-... — n’importe lequel peut livrer un credential actif à OpenAI, Anthropic ou Google en clair, où il atterrit dans leurs journaux et les vôtres. Secrets Blocker arrête ça à la passerelle : un preset de guardrail en un clic qui scanne la requête à la recherche de formes de credentials et rejette l’appel avec une HTTP 400 avant qu’un seul octet ne quitte votre passerelle. C’est une page d’atterrissage ciblée sur le cas d’usage de la fuite de secrets. Pour le moteur de guardrail complet — chaque type de règle, champ et route — voir la référence Guardrails.

1. Empêcher les flux de fuite de clé api llm en un preset

Tout l’intérêt de la plomberie prevent api key leak llm est d’attraper le credential avant l’appel en amont, pas après qu’il soit déjà dans le journal de requête d’un fournisseur. Le preset Secrets Blocker fait exactement cela. C’est un petit guardrail de règles block à l’étape input, chacune une regex pour une forme de credential bien connue :

Clé d'accès AWS

AKIA suivi de 16 caractères alphanumériques majuscules — la forme canonique de l’access-key-id AWS.

Clé secrète de style OpenAI

Un préfixe sk- suivi d’un long corps de token — la forme utilisée par OpenAI et plusieurs clés de fournisseurs ressemblantes.

Token d'accès personnel GitHub

Un préfixe ghp_ suivi d’un corps de 36 caractères.

Quand une règle correspond, la requête est bloquée — la passerelle ne la transmet jamais. La politique vit dans la passerelle, pas votre application, donc votre application continue d’appeler /v1/chat/completions exactement comme avant, sans changement de SDK et sans redéploiement.

Étape input, avant la mesure. Secrets Blocker filtre ce que vous envoyez. Une correspondance rejette l’appel avant que le modèle ne soit invoqué, donc le credential n’atteint jamais le fournisseur et une requête bloquée ne coûte aucun quota. Pour aussi attraper un secret qu’un modèle émet en retour vers le client, associez-le à un preset de block de sortie — voir §5.

2. Appliquer le preset dans la console

Chaque étape ici est une action de console sur la passerelle hébergée sous votre propre session. Créer et modifier des guardrails nécessite Developer+ dans l’espace de travail. Seul l’appel /v1/* final utilise une clé de relais sk-orca-....

Ouvrir le template

Dans la console, ouvrez Guardrails, cliquez sur le split-button New guardrail, et choisissez Secrets & API-Key Blocker dans la catégorie de templates Secrets. Il sème les règles de block à l’étape input.

Nommer et enregistrer

Donnez-lui un nom (≤ 64 caractères), par exemple secrets-blocker, et enregistrez. Un preset est une graine, pas un verrou — ajoutez ou modifiez librement des règles ensuite (voir §4).

Le tester

Ouvrez l’onglet Test, collez un credential d’échantillon à l’étape input, et exécutez la politique localement — aucun appel en amont, aucun quota (voir §3).

Attacher une clé

Modifiez une clé API et choisissez secrets-blocker dans la liste déroulante Guardrail (définit guardrail_id sur la clé), ou marquez-le comme défaut de l’espace de travail. Voir Attacher à une clé et Défaut de compte.

3. Tester avant d’attacher

Prouvez que la règle se déclenche avant qu’une clé ne pointe vers elle. Ouvrez l’onglet Test à l’intérieur de l’éditeur, collez un credential factice, choisissez l’étape input, et lancez :

Here is my key: AKIAIOSFODNN7EXAMPLE

Le sandbox évalue la politique actuelle localement — rien n’est envoyé en amont, rien n’est mesuré — et renvoie le verdict block nommant la règle qui s’est déclenchée. Pour une grille A/B contre un corpus d’échantillons de secrets fuités et bénins, le harnais d’évaluation vit dans l’onglet d’à côté.

4. Étendre la couverture

Secrets Blocker couvre les trois formes au trafic le plus élevé. La catégorie Secrets livre des presets frères que vous pouvez appliquer à côté, et vous pouvez rédiger votre propre règle regex pour tout token que votre stack émet :

Private Keys & Cloud Tokens

Un preset Secrets compagnon qui bloque les clés privées PEM, les tokens Slack et Stripe, les clés API Google et les JWTs sur la requête.

Crypto Wallet Block

Bloque les adresses de portefeuille de type BTC et ETH sur la requête lorsqu’elles ne devraient jamais atteindre le fournisseur.

Pour correspondre à un format de token interne, ajoutez une règle regex — motifs RE2, temps linéaire, sans backreferences — à l’étape input avec l’action block. Les mauvais motifs sont rejetés à l’enregistrement, donc un guardrail que vous pouvez enregistrer compile toujours.

Plutôt que bloquer, vous voulez redacter un secret fuité et laisser passer la requête assainie ? Utilisez une règle pii avec une action mask — l’ensemble de détecteurs intégrés inclut aws_access_key, api_key_openai et jwt, chacun rendu en une balise typée comme [AWS_ACCESS_KEY]. Voir Actions pour block vs. mask.

5. Attraper aussi les secrets dans la réponse

Secrets Blocker filtre la requête. Un preset Secrets distinct, Code Secret in Output, filtre la réponse du modèle à la recherche de clés privées et de tokens de style AWS/OpenAI et bloque l’appel si l’un fuit en retour. Le block de sortie est appliqué dans les deux cas : sur une réponse non-streaming, la réponse est filtrée avant son retour, et sur une réponse streaming, un scanner coupe le flux avant que tout contenu bloqué n’atteigne le client. Un block à l’étape output rembourse le quota pré-consommé. Voir Règles à l’étape output et Couverture du streaming.

6. À quoi ressemble un block

Une requête bloquée renvoie une HTTP 400 avec le code d’erreur guardrail_blocked et un message nommant le guardrail et la règle qui s’est déclenchée :

{
  "error": {
    "code": "guardrail_blocked",
    "message": "request blocked by guardrail \"secrets-blocker\": regex(...)"
  }
}

La requête ne coûte aucun quota — un block à l’étape input se déclenche avant la mesure — et est marquée skip-retry, puisque ré-exécuter le même prompt contre un autre canal ne ferait que bloquer à nouveau. Voir l’erreur guardrail_blocked.

7. Voir ce qui s’est déclenché

Chaque règle qui se déclenche enregistre une correspondance — type de règle, action, étape et une chaîne de détail — qui apparaît dans le flux Matches de l’espace de travail. La sous-chaîne correspondante elle-même (le credential) n’est enregistrée que lorsque Log raw content est activé, ce qui est désactivé par défaut.

Pour un contrôle de secrets, laisser Log raw content désactivé est généralement le but : capturer la sous-chaîne correspondante réécrirait le credential fuité directement dans votre propre télémétrie. Gardez-le désactivé à moins d’avoir un besoin de triage étroit, et faites tourner tout credential qui a été attrapé — une requête bloquée signifie que le secret a été exposé dans un prompt, pas qu’il est sûr. Voir Flux des correspondances et Journalisation & confidentialité.

8. Où aller ensuite

Détecteurs regex

Rédigez vos propres motifs de credentials avec des règles regex RE2.

Actions

Choisissez block, mask, flag, annotate ou spotlight par règle — et block, mask, flag ou annotate par entité.

PII Shield

Masquez les emails, SSN et cartes en balises typées avant que le modèle ne les voie.

Ajuster les faux positifs

Marquez les faux positifs et resserrez les détecteurs depuis le flux Matches.

Secrets Blocker garde les credentials hors du contenu que vous envoyez. Pour empêcher un agent de faire fuiter un secret via un appel d’outil — l’exfiltrant vers un hôte contrôlé par un attaquant — utilisez le Firewall et lisez la menace d’exfiltration de données et la menace de fuite de secrets. Pour le moteur de guardrail complet, voir la référence Guardrails.

​1. Empêcher les flux de fuite de clé api llm en un preset

​2. Appliquer le preset dans la console

​3. Tester avant d’attacher

​4. Étendre la couverture

Private Keys & Cloud Tokens

Crypto Wallet Block

​5. Attraper aussi les secrets dans la réponse

​6. À quoi ressemble un block

​7. Voir ce qui s’est déclenché

​8. Où aller ensuite

Détecteurs regex

Actions

PII Shield

Ajuster les faux positifs

1. Empêcher les flux de fuite de clé api llm en un preset

2. Appliquer le preset dans la console

3. Tester avant d’attacher

4. Étendre la couverture

5. Attraper aussi les secrets dans la réponse

6. À quoi ressemble un block

7. Voir ce qui s’est déclenché

8. Où aller ensuite