AKIA..., un .env collé, un agent qui
renvoie en écho son propre token sk-... — n’importe lequel peut livrer un
credential actif à OpenAI, Anthropic ou Google en clair, où il atterrit dans
leurs journaux et les vôtres. Secrets Blocker arrête ça à la passerelle :
un preset de guardrail en un clic qui scanne la requête à la recherche de
formes de credentials et rejette l’appel avec une HTTP 400 avant qu’un seul
octet ne quitte votre passerelle.
C’est une page d’atterrissage ciblée sur le cas d’usage de la fuite de secrets.
Pour le moteur de guardrail complet — chaque type de règle, champ et route —
voir la référence Guardrails.
1. Empêcher les flux de fuite de clé api llm en un preset
Tout l’intérêt de la plomberieprevent api key leak llm est d’attraper le
credential avant l’appel en amont, pas après qu’il soit déjà dans le journal
de requête d’un fournisseur. Le preset Secrets Blocker fait exactement
cela. C’est un petit guardrail de règles block à l’étape input, chacune
une regex pour une forme de credential bien connue :
Clé d'accès AWS
Clé d'accès AWS
AKIA suivi de 16 caractères alphanumériques majuscules — la forme
canonique de l’access-key-id AWS.Clé secrète de style OpenAI
Clé secrète de style OpenAI
Un préfixe
sk- suivi d’un long corps de token — la forme utilisée par
OpenAI et plusieurs clés de fournisseurs ressemblantes.Token d'accès personnel GitHub
Token d'accès personnel GitHub
Un préfixe
ghp_ suivi d’un corps de 36 caractères./v1/chat/completions exactement
comme avant, sans changement de SDK et sans redéploiement.
Étape input, avant la mesure. Secrets Blocker filtre ce que vous
envoyez. Une correspondance rejette l’appel avant que le modèle ne soit
invoqué, donc le credential n’atteint jamais le fournisseur et une requête
bloquée ne coûte aucun quota. Pour aussi attraper un secret qu’un modèle
émet en retour vers le client, associez-le à un preset de block de sortie —
voir §5.
2. Appliquer le preset dans la console
Chaque étape ici est une action de console sur la passerelle hébergée sous votre propre session. Créer et modifier des guardrails nécessite Developer+ dans l’espace de travail. Seul l’appel/v1/* final utilise une clé de relais
sk-orca-....
Ouvrir le template
Dans la console, ouvrez Guardrails, cliquez sur le split-button New
guardrail, et choisissez Secrets & API-Key Blocker dans la catégorie
de templates Secrets. Il sème les règles de block à l’étape input.
Nommer et enregistrer
Donnez-lui un nom (≤ 64 caractères), par exemple
secrets-blocker, et
enregistrez. Un preset est une graine, pas un verrou — ajoutez ou modifiez
librement des règles ensuite (voir §4).Le tester
Ouvrez l’onglet Test, collez un credential d’échantillon à l’étape
input, et exécutez la politique localement — aucun appel en amont, aucun
quota (voir §3).Attacher une clé
Modifiez une clé API et choisissez
secrets-blocker dans la liste
déroulante Guardrail (définit guardrail_id sur la clé), ou marquez-le
comme défaut de l’espace de travail. Voir
Attacher à une clé et
Défaut de compte.3. Tester avant d’attacher
Prouvez que la règle se déclenche avant qu’une clé ne pointe vers elle. Ouvrez l’onglet Test à l’intérieur de l’éditeur, collez un credential factice, choisissez l’étapeinput, et lancez :
4. Étendre la couverture
Secrets Blocker couvre les trois formes au trafic le plus élevé. La catégorie Secrets livre des presets frères que vous pouvez appliquer à côté, et vous pouvez rédiger votre propre règleregex pour tout token que votre stack
émet :
Private Keys & Cloud Tokens
Un preset Secrets compagnon qui bloque les clés privées PEM, les tokens
Slack et Stripe, les clés API Google et les JWTs sur la requête.
Crypto Wallet Block
Bloque les adresses de portefeuille de type BTC et ETH sur la requête
lorsqu’elles ne devraient jamais atteindre le fournisseur.
regex — motifs RE2, temps
linéaire, sans backreferences — à l’étape input avec l’action block. Les
mauvais motifs sont rejetés à l’enregistrement, donc un guardrail que vous
pouvez enregistrer compile toujours.
5. Attraper aussi les secrets dans la réponse
Secrets Blocker filtre la requête. Un preset Secrets distinct, Code Secret in Output, filtre la réponse du modèle à la recherche de clés privées et de tokens de style AWS/OpenAI et bloque l’appel si l’un fuit en retour. Le block de sortie est appliqué dans les deux cas : sur une réponse non-streaming, la réponse est filtrée avant son retour, et sur une réponse streaming, un scanner coupe le flux avant que tout contenu bloqué n’atteigne le client. Un block à l’étape output rembourse le quota pré-consommé. Voir Règles à l’étape output et Couverture du streaming.6. À quoi ressemble un block
Une requête bloquée renvoie une HTTP 400 avec le code d’erreurguardrail_blocked et un message nommant le guardrail et la règle qui s’est
déclenchée :
guardrail_blocked.
7. Voir ce qui s’est déclenché
Chaque règle qui se déclenche enregistre une correspondance — type de règle, action, étape et une chaîne de détail — qui apparaît dans le flux Matches de l’espace de travail. La sous-chaîne correspondante elle-même (le credential) n’est enregistrée que lorsque Log raw content est activé, ce qui est désactivé par défaut.8. Où aller ensuite
Détecteurs regex
Rédigez vos propres motifs de credentials avec des règles regex RE2.
Actions
Choisissez block, mask, flag, annotate ou spotlight par règle — et block,
mask, flag ou annotate par entité.
PII Shield
Masquez les emails, SSN et cartes en balises typées avant que le modèle ne
les voie.
Ajuster les faux positifs
Marquez les faux positifs et resserrez les détecteurs depuis le flux
Matches.
