Blocca la fuga di segreti e credenziali

Un prompt che porta una chiave AKIA..., un .env incollato, un agent che fa eco al proprio token sk-... — ognuno di essi può spedire una credenziale attiva a OpenAI, Anthropic o Google in chiaro, dove atterra nei loro log e nei tuoi. Secrets Blocker lo ferma al gateway: un preset di guardrail a un clic che scansiona la richiesta per forme di credenziale e rifiuta la chiamata con HTTP 400 prima che un singolo byte lasci il tuo gateway. Questa è una landing focalizzata sul caso d’uso della fuga di segreti. Per il motore di guardrail completo — ogni tipo di regola, campo e rotta — vedi il riferimento Guardrails.

1. Previeni i flussi di api key leak llm in un preset

Tutto il punto dell’idraulica di prevent api key leak llm è catturare la credenziale prima della chiamata upstream, non dopo che è già nel log delle richieste di un provider. Il preset Secrets Blocker fa esattamente questo. È un piccolo guardrail di regole block nello stage di input, ciascuna una regex per una forma di credenziale ben nota:

Chiave di accesso AWS

AKIA seguito da 16 caratteri alfanumerici maiuscoli — la forma canonica dell’access-key-id AWS.

Chiave segreta in stile OpenAI

Un prefisso sk- seguito da un lungo corpo di token — la forma usata da OpenAI e da diverse chiavi di provider somiglianti.

Personal access token GitHub

Un prefisso ghp_ seguito da un corpo di 36 caratteri.

Quando una qualsiasi regola corrisponde, la richiesta viene bloccata — il gateway non la inoltra mai. La policy vive nel gateway, non nella tua applicazione, quindi la tua app continua a chiamare /v1/chat/completions esattamente come prima, senza modifiche all’SDK e senza redeploy.

Stage di input, prima della misurazione. Secrets Blocker filtra ciò che invii. Un match rifiuta la chiamata prima che il modello sia invocato, quindi la credenziale non raggiunge mai il provider e una richiesta bloccata non costa quota. Per catturare anche un segreto che un modello emette di ritorno al client, abbinalo a un preset di block sull’output — vedi §5.

2. Applica il preset nella console

Ogni passaggio qui è un’azione di console sul gateway gestito sotto la tua sessione. Creare e modificare guardrails richiede Developer+ nel workspace. Solo la chiamata /v1/* finale usa una chiave di relay sk-orca-....

Apri il template

Nella console, apri Guardrails, fai clic sullo split-button New guardrail e scegli Secrets & API-Key Blocker dalla categoria di template Secrets. Semina le regole di block nello stage di input.

Nomina e salva

Dagli un nome (≤ 64 caratteri), es. secrets-blocker, e salva. Un preset è un seme, non un lucchetto — aggiungi o modifica regole liberamente dopo (vedi §4).

Testalo

Apri la tab Test, incolla una credenziale di esempio nello stage input ed esegui la policy localmente — nessuna chiamata upstream, nessuna quota (vedi §3).

Collega una chiave

Modifica una chiave API e scegli secrets-blocker dal menu a tendina Guardrail (imposta guardrail_id sulla chiave), o marcalo come default del workspace. Vedi Collega a una chiave e Default di account.

3. Testa prima di collegare

Dimostra che la regola scatta prima che qualsiasi chiave vi punti. Apri la tab Test all’interno dell’editor, incolla una credenziale fittizia, scegli lo stage input ed esegui:

Here is my key: AKIAIOSFODNN7EXAMPLE

La sandbox valuta la policy corrente localmente — nulla viene inviato upstream, nulla viene misurato — e restituisce il verdetto block che nomina la regola che ha scattato. Per una griglia A/B contro un corpus di campioni di segreti trapelati e benigni, l’ harness di eval vive una tab più in là.

4. Estendi la copertura

Secrets Blocker copre le tre forme a più alto traffico. La categoria Secrets porta preset fratelli che puoi applicare accanto a esso, e puoi scrivere la tua regola regex per qualsiasi token che il tuo stack emette:

Private Keys & Cloud Tokens

Un preset Secrets complementare che blocca chiavi private PEM, token Slack e Stripe, chiavi API Google e JWT sulla richiesta.

Crypto Wallet Block

Blocca indirizzi di wallet in stile BTC ed ETH sulla richiesta quando non dovrebbero mai raggiungere il provider.

Per corrispondere a un formato di token interno, aggiungi una regola regex — pattern RE2, tempo lineare, nessuna backreference — nello stage input con azione block. I pattern difettosi sono rifiutati al salvataggio, quindi un guardrail che puoi salvare compila sempre.

Invece di bloccare, vuoi redigere un segreto trapelato e lasciar passare la richiesta sanitizzata? Usa una regola pii con un’azione mask — l’insieme di detector integrati include aws_access_key, api_key_openai e jwt, ciascuno renderizzato in un tag tipizzato come [AWS_ACCESS_KEY]. Vedi Azioni per block vs. mask.

5. Cattura anche i segreti nella risposta

Secrets Blocker filtra la richiesta. Un preset Secrets separato, Code Secret in Output, filtra la risposta del modello per chiavi private e token in stile AWS/OpenAI e blocca la chiamata se uno trapela di ritorno. Il block di output è applicato in entrambi i casi: su una risposta non in streaming la risposta viene filtrata prima che torni, e su una risposta in streaming uno scanner interrompe lo stream prima che qualsiasi contenuto bloccato raggiunga il client. Un block nello stage di output rimborsa la quota pre-consumata. Vedi Regole dello stage di output e Streaming coverage.

6. Com’è fatto un block

Una richiesta bloccata restituisce HTTP 400 con codice di errore guardrail_blocked e un messaggio che nomina il guardrail e la regola che ha scattato:

{
  "error": {
    "code": "guardrail_blocked",
    "message": "request blocked by guardrail \"secrets-blocker\": regex(...)"
  }
}

La richiesta non costa quota — un block nello stage di input scatta prima della misurazione — ed è marcata skip-retry, dato che rieseguire lo stesso prompt contro un altro canale si limiterebbe a bloccarlo di nuovo. Vedi l’ errore guardrail_blocked.

7. Vedi cosa è scattato

Ogni regola che scatta registra un match — tipo di regola, azione, stage e una stringa di detail — fatto emergere nel feed Matches del workspace. La sottostringa corrispondente stessa (la credenziale) viene registrata solo quando Log raw content è attivo, che è disattivato per default.

Per un controllo di segreti, lasciare Log raw content disattivato è di solito il punto: catturare la sottostringa corrispondente riscriverebbe la credenziale trapelata dritta nella tua telemetria. Tienilo disattivato a meno che tu non abbia un bisogno ristretto di triage, e ruota qualsiasi credenziale catturata — una richiesta bloccata significa che il segreto è stato esposto in un prompt, non che è sicuro. Vedi Feed dei match e Logging e privacy.

8. Dove andare dopo

Regex detector

Scrivi i tuoi pattern di credenziale con regole regex RE2.

Azioni

Scegli block, mask, flag, annotate o spotlight per regola — e block, mask, flag o annotate per entità.

PII Shield

Maschera email, SSN e carte in tag tipizzati prima che il modello li veda.

Tuning dei falsi positivi

Segnala i falsi positivi e irrigidisci i detector dal feed dei Matches.

Secrets Blocker tiene le credenziali fuori dal contenuto che invii. Per impedire a un agent di far trapelare un segreto attraverso una chiamata a tool — esfiltrando verso un host controllato da un attaccante — usa il Firewall e leggi la minaccia di esfiltrazione di dati e la minaccia di fuga di segreti. Per il motore di guardrail completo, vedi il riferimento Guardrails.

​1. Previeni i flussi di api key leak llm in un preset

​2. Applica il preset nella console

​3. Testa prima di collegare

​4. Estendi la copertura

Private Keys & Cloud Tokens

Crypto Wallet Block

​5. Cattura anche i segreti nella risposta

​6. Com’è fatto un block

​7. Vedi cosa è scattato

​8. Dove andare dopo

Regex detector

Azioni

PII Shield

Tuning dei falsi positivi

1. Previeni i flussi di api key leak llm in un preset

2. Applica il preset nella console

3. Testa prima di collegare

4. Estendi la copertura

5. Cattura anche i segreti nella risposta

6. Com’è fatto un block

7. Vedi cosa è scattato

8. Dove andare dopo