1. Il caso d’uso della redazione PII LLM in una regola
La parte difficile dell’idraulica dipii redaction llm è di solito l’idraulica.
PII Shield la rimuove. Il preset è una singola regola pii:
- Type: PII detection (
pii) - Action: Mask — sostituisce ogni match con un tag tipizzato
- Entities:
email,phone,ssn,credit_card,ip
/v1/chat/completions esattamente come prima.
Il masking nello stage di input è il percorso attivo. PII Shield maschera la
richiesta prima che lasci il gateway, così il modello upstream non vede mai
il valore originale. Il masking attivo dell’output del modello e delle
risposte in streaming è nella roadmap; inquadra PII Shield come ciò che pulisce
quello che invii, non quello che torna. Per gestire le risposte del modello
oggi, una regola block di output è applicata in entrambi i casi — vedi
Regole dello stage di output e
Streaming coverage.
2. Applica il preset nella console
Ogni passaggio qui è un’azione di console sul gateway gestito sotto la tua sessione. Creare e modificare guardrails richiede Developer+ nel workspace. Solo la chiamata/v1/* finale usa una chiave di relay sk-orca-....
Apri il template
Nella console, apri Guardrails, fai clic sullo split-button New
guardrail e scegli PII Shield dalla categoria di template PII.
Semina una singola regola
pii di masking.Nomina e salva
Dagli un nome (≤ 64 caratteri), es.
pii-shield, e salva. Un preset è un
seme, non un lucchetto — modifica liberamente l’elenco di entità o l’azione
dopo.Testalo
Apri la tab Test, incolla un campione nello stage
input ed esegui la
policy localmente — nessuna chiamata upstream, nessuna quota (vedi
§4).Collega una chiave
Modifica una chiave API e scegli
pii-shield dal menu a tendina
Guardrail (imposta guardrail_id sulla chiave), o marcalo come
default del workspace. Vedi
Collega a una chiave e
Default di account.3. Cosa viene mascherato, e in cosa
Su un’azione mask ogni match viene sostituito con un tag tipizzato — un’email diventa[EMAIL], un SSN diventa [SSN]. L’insieme di detector
integrati è chiuso e condiviso dal motore, dalla sandbox e dal rule builder:
Entità integrate
Entità integrate
email, phone, credit_card, ssn, ip, iban,
mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address.Identificatori regionali
Identificatori regionali
jp_mynumber (My Number Giappone → [JP_MYNUMBER]), kr_rrn (RRN Corea
→ [KR_RRN]), e cn_resident_id (ID residente Cina →
[CN_RESIDENT_ID]). Abilita quelli che corrispondono alla tua giurisdizione.Le tue entità personalizzate
Le tue entità personalizzate
Sovrapponi un detector regex agli integrati — un
employee_id, un numero di
conto interno — con un checksum luhn opzionale e una sostituzione
personalizzata. Fino a 25 per regola. Vedi
Entità PII personalizzate e
Formati di masking.4. Testa prima di collegare
Dimostra che la regola fa ciò che ti aspetti prima che qualsiasi chiave vi punti. Apri la tab Test all’interno dell’editor, incolla un campione, scegli lo stageinput ed esegui:
5. Invia una richiesta
Usando una chiave legata apii-shield, chiama OrcaRouter esattamente come prima
— nessun nuovo header, nessuna modifica all’SDK:
[EMAIL] prima di inoltrare — il modello upstream
riceve Reply to [EMAIL] please e non vede mai l’indirizzo.
6. Vedi cosa è scattato
Ogni regola che scatta registra un match — tipo di regola, azione, stage e una stringa di detail — fatto emergere nel feed Matches del workspace. La sottostringa corrispondente stessa (l’indirizzo email effettivo) viene registrata solo quando Log raw content è attivo, che è disattivato per default — la postura conservativa sulla privacy che tiene la PII redatta fuori anche dalla tua telemetria.Per un controllo di redazione, lasciare Log raw content disattivato è di
solito il punto: arrivi a vedere che un’
email è stata mascherata e quanto
spesso, senza ricatturare il valore che hai appena pulito. Attivalo per ciascun
guardrail solo quando ti serve la sottostringa per il triage; l’impostazione non
è retroattiva. Vedi Feed dei match e
Logging e privacy.7. Dove andare dopo
Entità PII personalizzate
Aggiungi i tuoi detector regex con controlli Luhn opzionali, fino a 25 per
regola.
Formati di masking
Controlla il tag tipizzato in cui ogni entità viene renderizzata.
Block secrets
Cattura chiavi API e credenziali con il preset Secrets Blocker.
Tuning dei falsi positivi
Segnala i falsi positivi e irrigidisci i detector dal feed dei Matches.
