1. Logging privacy dei guardrail: disattivato per default
Ogni guardrail porta un singolo toggle per-policy, Log raw content, e parte disattivato. Con esso disattivato, un match registra i metadati di ciò che è scattato ma non copia mai il testo incriminato nel feed:Registrato con il toggle DISATTIVATO
Tipo di regola, azione, stage e una breve stringa di detail — abbastanza per
sapere che una regola
pii ha mascherato un’email sulla richiesta, senza
memorizzare l’indirizzo.Aggiunto solo quando ATTIVO
Le sottostringhe corrispondenti — il testo letterale che la regola ha
catturato. Catturate solo per i match registrati dopo che abiliti il toggle.
Disattivato per default è la postura conservativa sulla privacy. La
sottostringa corrispondente è la cosa più sensibile che un guardrail potrebbe
loggare — è, per definizione, il dato che la regola esiste per catturare.
OrcaRouter non lo memorizza a meno che tu non opti per esso per ciascun guardrail.
2. Cosa contiene un record di match
Un match è un piccolo record diagnostico con scope a livello di workspace. Con Log raw content disattivato, porta solo metadati:| Campo | Esempio | Presente quando il toggle è disattivato? |
|---|---|---|
| Tipo di regola | pii, regex, keyword | Sì |
| Azione | block, mask, flag | Sì |
| Stage | input, output | Sì |
| Detail | breve stringa di classificazione (es. l’entità) | Sì |
| Sottostringa corrispondente | jane@acme.com | Solo quando ATTIVO |
3. Un esempio concreto
Prendi un guardrail con una regolapii che maschera email sulla richiesta,
collegato a una chiave. Un chiamante invia:
[EMAIL] prima che il modello lo veda, e un
match atterra nel feed. Cosa contiene quel match dipende interamente dal toggle:
Log raw content DISATTIVATO (default)
Log raw content DISATTIVATO (default)
Il match registra: tipo di regola
pii, azione mask, stage input e una
stringa di detail che nomina l’entità email. Non memorizza
jane@acme.com. Sai che un’email è stata mascherata sulla richiesta; non puoi
rileggere l’email fuori dal feed.Log raw content ATTIVO
Log raw content ATTIVO
Lo stesso match porta in aggiunta la sottostringa corrispondente —
jane@acme.com — così puoi confermare precisamente cosa la regola ha catturato
durante un passaggio di triage.4. Attivarlo (e la garanzia non-retroattiva)
Log raw content è un’impostazione per-guardrail. Modificare un guardrail è un’azione di console sotto la tua sessione e richiede Developer+ nel workspace — solo la chiamata/v1/* finale usa una chiave di relay sk-orca-....
Apri il guardrail
Nella console, apri Guardrails e modifica la policy per cui vuoi catturare
le sottostringhe.
Abilita Log raw content
Attiva il toggle Log raw content e salva. Il salvataggio scrive una riga di
cronologia versionata, quindi la modifica è auditabile e ripristinabile — vedi
Versioning.
5. Cosa viene catturato quando è attivo
Quando Log raw content è attivo, il motore allega il testo letterale corrispondente a ogni violazione, con due limiti rigidi che impediscono a un input patologico di gonfiare un singolo record di match:- Al massimo 32 voci corrispondenti per violazione.
- Ogni voce è limitata a 256 caratteri.
Anche con il toggle attivo, un guardrail registra sempre solo il testo che una
regola ha effettivamente corrisposto. Il prompt circostante e il resto della
risposta non vengono mai copiati nel feed dei Matches. I payload completi di
richiesta/risposta sono una preoccupazione separata dalla diagnostica dei
guardrail.
6. Rimuovere sottostringhe che hai già catturato
Poiché il toggle non è retroattivo, disattivarlo lascia in posizione le sottostringhe precedenti. Due superfici le cancellano:| Vuoi rimuovere | Come |
|---|---|
| Un match rumoroso | Segnalalo come falso positivo — POST /api/guardrail/match/:id/mark-fp (Admin del workspace), o l’azione Mark false positive nel feed. |
| Tutti i match di guardrail per un utente | Un’auto-eliminazione dell’utente attiva una finestra di grazia di 30 giorni, poi uno scrub di PII che si propaga attraverso match di guardrail, request log ed eventi del firewall. Vedi Compliance. |
7. Chi può leggere cosa
Il feed dei Matches è dato diagnostico con scope a livello di workspace. L’accesso in lettura è aperto a ogni member attivo; l’azione distruttiva di falso positivo è gestita più in alto:| Azione | Rotta | Ruolo |
|---|---|---|
| Elenca / raggruppa / stats / esporta match | GET /api/guardrail/match* | Member |
| Dettaglio di un singolo match | GET /api/guardrail/match/:id | Member |
| Segna / desegna falso positivo | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| Modifica un guardrail (incl. Log raw content) | PUT /api/guardrail/ | Developer+ |
8. Un default di privacy pratico
Per la maggior parte dei workspace la forma giusta è: lascia Log raw content disattivato, esegui i tuoi guardrails sui metadati, e aziona il toggle temporaneamente per una singola policy quando stai attivamente debuggando perché una regola scatta nel modo in cui lo fa. Poi disattivalo di nuovo — i nuovi match smettono di portare sottostringhe immediatamente.9. Dove andare dopo
Feed dei match
Sfoglia, raggruppa, filtra ed esporta ogni match registrato.
Tuning dei falsi positivi
Segnala e affina i match per silenziare una regola rumorosa.
Versioning
Ogni azionamento del toggle è una modifica versionata e ripristinabile.
Compliance
Retention, cancellazione del soggetto dei dati e report firmati.
