/v1/chat/completions auf.
Jeder Konfigurationsschritt ist rollengesteuert. Ein Guardrail zu verfassen
erfordert Developer+; die Aufbewahrung oder Compliance-Residency zu ändern
erfordert Workspace-Admin. Das Lesen des Matches-Feeds ist für jedes
Mitglied offen.
1. Die PII-sichere Logging-Pipeline in drei Schritten
Eine PII-sichere Pipeline besteht aus drei unabhängigen Kontrollen, jede ein Schalter, den Sie einmal für den ganzen Workspace umlegen:Am Rand maskieren
Eine
pii-Guardrail-Regel redigiert E-Mails, SSNs, Karten und mehr zu
typisierten Tags, bevor das Upstream-Modell den Request je sieht.Keine rohen Inhalte loggen
Der Guardrail-Schalter Log raw content ist per Default aus, sodass der
Match-Feed aufzeichnet, dass eine Regel feuerte, niemals den gematchten
Teilstring.
Aufbewahrung begrenzen
Die Request-Log-Aufbewahrung beträgt per Default 30 Tage und ist
serverseitig auf ein hartes Maximum von 180 Tagen begrenzt —
kurzlebig per Design.
2. PII maskieren, bevor das Modell sie sieht
Erstellen Sie ein Guardrail mit einer einzelnenpii-Regel auf der
input-Stage und der mask-Aktion. Bei einer Mask-Aktion wird jeder
Treffer durch einen typisierten Tag ersetzt — eine E-Mail wird zu [EMAIL],
eine SSN wird zu [SSN] — sodass das Upstream-Modell einen bereinigten Request
erhält, nicht das Original.
Draft a reply to [EMAIL] about her SSN [SSN]. Die
Originalwerte verlassen nie das Gateway.
Input-Stage-Masking ist, worauf sich eine PII-sichere Pipeline stützt — es
scheuert den Request, bevor der Upstream-Aufruf erfolgt.
Output-Stage-Masking funktioniert sowohl auf Nicht-Streaming- als auch auf
Streaming-Antworten (Streaming schreibt jeden Chunk an Ort und Stelle um),
sodass Sie auch PII redigieren können, die das Modell ausgibt.
3. Rohe Inhalte aus Ihren Logs heraushalten
Jede Regel, die feuert, zeichnet einen Match auf — seinen Typ, seine Aktion, seine Stage und einen Detail-String. Ob der Match auch den gematchten Teilstring speichert (die tatsächliche E-Mail-Adresse, die tatsächliche SSN), wird durch den Log raw content-Schalter des Guardrails gesteuert, der per Default aus ist — die datenschutzkonservative Haltung.Mit Log raw content aus zeigt der Matches-Feed,
dass eine
pii-Regel eine email auf der input-Stage maskierte, aber
niemals die Adresse selbst. Das ist genau, was Sie für eine PII-sichere
Pipeline wollen: volle Auditierbarkeit dessen, was feuerte, null behaltene
PII. Lassen Sie ihn in Produktion aus; schalten Sie ihn pro Guardrail nur für
kurzlebige Triage ein. Der Schalter ist nicht rückwirkend.GET /api/guardrail/match,
Member). Gruppieren und filtern Sie nach Guardrail, Regeltyp und Aktion, um
Ihre Masking-Rate zu sehen, ohne je einen echten Wert offenzulegen. Einen Match
als False Positive zu markieren ist eine Admin-Aktion
(POST /api/guardrail/match/:id/mark-fp).
4. Begrenzen, wie lange Request-Logs leben
Die Request-Log-Erfassung ist ein Opt-in-Troubleshooting-Feature, und wenn sie an ist, ist die Aufbewahrung begrenzt:| Einstellung | Wert | Verhalten |
|---|---|---|
| Default-Aufbewahrung | 30 Tage | Angewendet, wenn kein Pro-Workspace-Wert gesetzt ist. |
| Hartes Maximum | 180 Tage | Jeder längere Wert wird serverseitig heruntergebremst. |
5. Recht-auf-Löschung und Residency
Zwei weitere Kontrollen runden eine konforme Pipeline ab:Löschungskaskade (DSAR)
Löschungskaskade (DSAR)
Eine Nutzer-Selbstlöschung tritt in ein 30-Tage-Grace-Fenster, nach dem
PII gescheuert wird und eine Kaskaden-Purge die Request-Logs, die
Guardrail-Matches und die Firewall-Events dieses Nutzers zusammen
entfernt — sodass kein Artefakt die Löschungsanfrage überlebt.
Compliance-Report-Residency
Compliance-Report-Residency
Setzen Sie die Region, an die Ihre Compliance-Report-Artefakte gepinnt
werden (
us, eu, uk, ap, cn, global), über
PUT /api/compliance/residency (Admin). Cross-Region-Lesungen eines
Reports werden zurückgehalten. Das pinnt die Region des
Report-Artefakts — es ist kein Geo-Pinning von Inferenzdaten.6. Verifizieren, bevor Sie ausliefern
Beweisen Sie, dass das Masking tut, was Sie erwarten, bevor irgendein Traffic davon abhängt:Die Regel in der Sandbox testen
Öffnen Sie den Test-Tab im Guardrail-Editor, fügen Sie Beispieltext mit
einer echt aussehenden E-Mail und SSN ein, wählen Sie die
input-Stage und
führen Sie aus. Die Sandbox gibt das Verdikt und den gerenderten Text
([EMAIL], [SSN]) zurück, ohne einen Upstream-Aufruf oder Kontingent-
Verbrauch.Gegen ein Korpus evaluieren
Der Eval-Tab führt die Policy über gebündelte oder Custom-JSONL-Korpora
aus, sodass Sie Trefferrate und False Positives messen können, bevor Sie
live gehen.
Verwandt
Guardrails-Referenz
Der vollständige PII-Entitäten-Satz, Custom-Entitäten,
Pro-Entitäts-Overrides und der Matches-Feed.
Eine RAG-Pipeline absichern
Grounding- und PII-Kontrollen für retrieval-augmentierte Agenten.
SOC-2-Evidenz
Guardrail- und Firewall-Aktivität in signierte Audit-Reports verwandeln.
Datenexfiltration
Das Bedrohungsmodell hinter dem Heraushalten von PII aus der Leitung und den
Logs.
