AKIA..., un .env incollato, un agent che fa
eco al proprio token sk-... — ognuno di essi può spedire una credenziale attiva
a OpenAI, Anthropic o Google in chiaro, dove atterra nei loro log e nei tuoi.
Secrets Blocker lo ferma al gateway: un preset di guardrail a un clic che
scansiona la richiesta per forme di credenziale e rifiuta la chiamata con
HTTP 400 prima che un singolo byte lasci il tuo gateway.
Questa è una landing focalizzata sul caso d’uso della fuga di segreti. Per il
motore di guardrail completo — ogni tipo di regola, campo e rotta — vedi il
riferimento Guardrails.
1. Previeni i flussi di api key leak llm in un preset
Tutto il punto dell’idraulica diprevent api key leak llm è catturare la
credenziale prima della chiamata upstream, non dopo che è già nel log delle
richieste di un provider. Il preset Secrets Blocker fa esattamente questo. È
un piccolo guardrail di regole block nello stage di input, ciascuna una
regex per una forma di credenziale ben nota:
Chiave di accesso AWS
Chiave di accesso AWS
AKIA seguito da 16 caratteri alfanumerici maiuscoli — la forma canonica
dell’access-key-id AWS.Chiave segreta in stile OpenAI
Chiave segreta in stile OpenAI
Un prefisso
sk- seguito da un lungo corpo di token — la forma usata da
OpenAI e da diverse chiavi di provider somiglianti.Personal access token GitHub
Personal access token GitHub
Un prefisso
ghp_ seguito da un corpo di 36 caratteri./v1/chat/completions
esattamente come prima, senza modifiche all’SDK e senza redeploy.
Stage di input, prima della misurazione. Secrets Blocker filtra ciò che
invii. Un match rifiuta la chiamata prima che il modello sia invocato, quindi
la credenziale non raggiunge mai il provider e una richiesta bloccata non costa
quota. Per catturare anche un segreto che un modello emette di ritorno al
client, abbinalo a un preset di block sull’output — vedi
§5.
2. Applica il preset nella console
Ogni passaggio qui è un’azione di console sul gateway gestito sotto la tua sessione. Creare e modificare guardrails richiede Developer+ nel workspace. Solo la chiamata/v1/* finale usa una chiave di relay sk-orca-....
Apri il template
Nella console, apri Guardrails, fai clic sullo split-button New
guardrail e scegli Secrets & API-Key Blocker dalla categoria di
template Secrets. Semina le regole di block nello stage di input.
Nomina e salva
Dagli un nome (≤ 64 caratteri), es.
secrets-blocker, e salva. Un preset è
un seme, non un lucchetto — aggiungi o modifica regole liberamente dopo
(vedi §4).Testalo
Apri la tab Test, incolla una credenziale di esempio nello stage
input
ed esegui la policy localmente — nessuna chiamata upstream, nessuna quota
(vedi §3).Collega una chiave
Modifica una chiave API e scegli
secrets-blocker dal menu a tendina
Guardrail (imposta guardrail_id sulla chiave), o marcalo come
default del workspace. Vedi
Collega a una chiave e
Default di account.3. Testa prima di collegare
Dimostra che la regola scatta prima che qualsiasi chiave vi punti. Apri la tab Test all’interno dell’editor, incolla una credenziale fittizia, scegli lo stageinput ed esegui:
4. Estendi la copertura
Secrets Blocker copre le tre forme a più alto traffico. La categoria Secrets porta preset fratelli che puoi applicare accanto a esso, e puoi scrivere la tua regolaregex per qualsiasi token che il tuo stack emette:
Private Keys & Cloud Tokens
Un preset Secrets complementare che blocca chiavi private PEM, token Slack
e Stripe, chiavi API Google e JWT sulla richiesta.
Crypto Wallet Block
Blocca indirizzi di wallet in stile BTC ed ETH sulla richiesta quando non
dovrebbero mai raggiungere il provider.
regex — pattern RE2, tempo
lineare, nessuna backreference — nello stage input con azione block. I
pattern difettosi sono rifiutati al salvataggio, quindi un guardrail che puoi
salvare compila sempre.
5. Cattura anche i segreti nella risposta
Secrets Blocker filtra la richiesta. Un preset Secrets separato, Code Secret in Output, filtra la risposta del modello per chiavi private e token in stile AWS/OpenAI e blocca la chiamata se uno trapela di ritorno. Il block di output è applicato in entrambi i casi: su una risposta non in streaming la risposta viene filtrata prima che torni, e su una risposta in streaming uno scanner interrompe lo stream prima che qualsiasi contenuto bloccato raggiunga il client. Un block nello stage di output rimborsa la quota pre-consumata. Vedi Regole dello stage di output e Streaming coverage.6. Com’è fatto un block
Una richiesta bloccata restituisce HTTP 400 con codice di erroreguardrail_blocked e un messaggio che nomina il guardrail e la regola che ha
scattato:
guardrail_blocked.
7. Vedi cosa è scattato
Ogni regola che scatta registra un match — tipo di regola, azione, stage e una stringa di detail — fatto emergere nel feed Matches del workspace. La sottostringa corrispondente stessa (la credenziale) viene registrata solo quando Log raw content è attivo, che è disattivato per default.8. Dove andare dopo
Regex detector
Scrivi i tuoi pattern di credenziale con regole regex RE2.
Azioni
Scegli block, mask, flag, annotate o spotlight per regola — e block, mask, flag o annotate per entità.
PII Shield
Maschera email, SSN e carte in tag tipizzati prima che il modello li veda.
Tuning dei falsi positivi
Segnala i falsi positivi e irrigidisci i detector dal feed dei Matches.
