Vai al contenuto principale
Vuoi tenere i dati personali fuori dal modello upstream. Un cliente incolla un indirizzo email, una trascrizione di supporto porta un numero di carta, un prompt di agent fa trapelare un SSN — e nulla di ciò dovrebbe raggiungere OpenAI, Anthropic o Google in chiaro. PII Shield è il modo più rapido per risolverlo: un preset di guardrail a una regola che rileva entità sensibili nella richiesta e maschera ciascuna in un tag tipizzato prima che il gateway inoltri la chiamata. Questa è una landing focalizzata sul caso d’uso del masking di PII. Per il motore di guardrail completo — ogni tipo di regola, campo e rotta — vedi il riferimento Guardrails.

1. Il caso d’uso della redazione PII LLM in una regola

La parte difficile dell’idraulica di pii redaction llm è di solito l’idraulica. PII Shield la rimuove. Il preset è una singola regola pii:
  • Type: PII detection (pii)
  • Action: Mask — sostituisce ogni match con un tag tipizzato
  • Entities: email, phone, ssn, credit_card, ip
Applicalo una volta nella console, collegalo a una chiave, e ogni chiamata su quella chiave viene filtrata senza modifiche all’SDK e senza redeploy. La policy vive nel gateway, non nella tua applicazione — la tua app continua a chiamare /v1/chat/completions esattamente come prima.
Il masking nello stage di input è il percorso attivo. PII Shield maschera la richiesta prima che lasci il gateway, così il modello upstream non vede mai il valore originale. Il masking attivo dell’output del modello e delle risposte in streaming è nella roadmap; inquadra PII Shield come ciò che pulisce quello che invii, non quello che torna. Per gestire le risposte del modello oggi, una regola block di output è applicata in entrambi i casi — vedi Regole dello stage di output e Streaming coverage.

2. Applica il preset nella console

Ogni passaggio qui è un’azione di console sul gateway gestito sotto la tua sessione. Creare e modificare guardrails richiede Developer+ nel workspace. Solo la chiamata /v1/* finale usa una chiave di relay sk-orca-....
1

Apri il template

Nella console, apri Guardrails, fai clic sullo split-button New guardrail e scegli PII Shield dalla categoria di template PII. Semina una singola regola pii di masking.
2

Nomina e salva

Dagli un nome (≤ 64 caratteri), es. pii-shield, e salva. Un preset è un seme, non un lucchetto — modifica liberamente l’elenco di entità o l’azione dopo.
3

Testalo

Apri la tab Test, incolla un campione nello stage input ed esegui la policy localmente — nessuna chiamata upstream, nessuna quota (vedi §4).
4

Collega una chiave

Modifica una chiave API e scegli pii-shield dal menu a tendina Guardrail (imposta guardrail_id sulla chiave), o marcalo come default del workspace. Vedi Collega a una chiave e Default di account.

3. Cosa viene mascherato, e in cosa

Su un’azione mask ogni match viene sostituito con un tag tipizzato — un’email diventa [EMAIL], un SSN diventa [SSN]. L’insieme di detector integrati è chiuso e condiviso dal motore, dalla sandbox e dal rule builder:
email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.
jp_mynumber (My Number Giappone → [JP_MYNUMBER]), kr_rrn (RRN Corea → [KR_RRN]), e cn_resident_id (ID residente Cina → [CN_RESIDENT_ID]). Abilita quelli che corrispondono alla tua giurisdizione.
Sovrapponi un detector regex agli integrati — un employee_id, un numero di conto interno — con un checksum luhn opzionale e una sostituzione personalizzata. Fino a 25 per regola. Vedi Entità PII personalizzate e Formati di masking.
Una regola PII può applicare azioni diverse a entità diverse tramite entity_actions — mascherare email / phone / ip, ma bloccare su credit_card o ssn. Nessun bisogno di regole sovrapposte. Vedi Azioni.

4. Testa prima di collegare

Dimostra che la regola fa ciò che ti aspetti prima che qualsiasi chiave vi punti. Apri la tab Test all’interno dell’editor, incolla un campione, scegli lo stage input ed esegui:
Reply to jane@acme.com please
La sandbox valuta la policy corrente localmente e restituisce il verdetto più il testo renderizzato — nulla viene inviato upstream, nulla viene misurato:
Reply to [EMAIL] please
Per una griglia A/B contro un corpus, l’ harness di eval vive una tab più in là.

5. Invia una richiesta

Usando una chiave legata a pii-shield, chiama OrcaRouter esattamente come prima — nessun nuovo header, nessuna modifica all’SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
Il gateway maschera l’email in [EMAIL] prima di inoltrare — il modello upstream riceve Reply to [EMAIL] please e non vede mai l’indirizzo.
Cambia l’azione di un’entità in block (tramite override per entità) e la richiesta immediatamente successiva che porta quell’entità viene rifiutata con HTTP 400 guardrail_blocked. Una richiesta bloccata non costa quota (un block di input scatta prima della misurazione) ed è marcata skip-retry. Vedi l’errore guardrail_blocked.

6. Vedi cosa è scattato

Ogni regola che scatta registra un match — tipo di regola, azione, stage e una stringa di detail — fatto emergere nel feed Matches del workspace. La sottostringa corrispondente stessa (l’indirizzo email effettivo) viene registrata solo quando Log raw content è attivo, che è disattivato per default — la postura conservativa sulla privacy che tiene la PII redatta fuori anche dalla tua telemetria.
Per un controllo di redazione, lasciare Log raw content disattivato è di solito il punto: arrivi a vedere che un’email è stata mascherata e quanto spesso, senza ricatturare il valore che hai appena pulito. Attivalo per ciascun guardrail solo quando ti serve la sottostringa per il triage; l’impostazione non è retroattiva. Vedi Feed dei match e Logging e privacy.

7. Dove andare dopo

Entità PII personalizzate

Aggiungi i tuoi detector regex con controlli Luhn opzionali, fino a 25 per regola.

Formati di masking

Controlla il tag tipizzato in cui ogni entità viene renderizzata.

Block secrets

Cattura chiavi API e credenziali con il preset Secrets Blocker.

Tuning dei falsi positivi

Segnala i falsi positivi e irrigidisci i detector dal feed dei Matches.
PII Shield maschera il contenuto. Per governare le chiamate a tool di un agent — negare azioni distruttive, redigere gli argomenti delle chiamate a tool, richiedere approvazione — usa il Firewall. Parti da Proteggere gli agent AI e dalla minaccia di esfiltrazione di dati, o leggi il riferimento Guardrails per il motore completo.