PII mit PII Shield redigieren

Sie möchten persönliche Daten aus dem Upstream-Modell heraushalten. Ein Kunde fügt eine E-Mail-Adresse ein, ein Support-Transkript trägt eine Kartennummer, ein Agent-Prompt leakt eine SSN — und nichts davon sollte OpenAI, Anthropic oder Google im Klartext erreichen. PII Shield ist der schnellste Weg, das zu beheben: ein Guardrail-Preset mit einer Regel, das sensible Entities in der Anfrage erkennt und jede zu einem typisierten Tag maskiert, bevor das Gateway den Aufruf weiterleitet. Dies ist eine fokussierte Landing für den PII-Masking-Anwendungsfall. Für die vollständige Guardrail-Engine — jeder Regeltyp, jedes Feld, jede Route — siehe die Guardrails-Referenz.

1. PII-Redaktion mit LLM in einer Regel

Der schwierige Teil von pii redaction llm-Plumbing ist meist das Plumbing. PII Shield entfernt es. Das Preset ist eine einzelne pii-Regel:

Type: PII detection (pii)
Action: Mask — jeden Treffer durch einen typisierten Tag ersetzen
Entities: email, phone, ssn, credit_card, ip

Wenden Sie es einmal in der Konsole an, hängen Sie es an einen Key an, und jeder Aufruf auf diesem Key wird ohne SDK-Änderung und ohne Redeploy geprüft. Die Policy lebt im Gateway, nicht in Ihrer Anwendung — Ihre App ruft /v1/chat/completions weiterhin genau wie zuvor auf.

Input-Stage-Masking ist der Live-Pfad. PII Shield maskiert die Anfrage, bevor sie das Gateway verlässt, sodass das Upstream-Modell den Originalwert nie sieht. Live-Masking des Modell-Outputs und gestreamter Responses ist auf der Roadmap; rahmen Sie PII Shield als das Scrubbing dessen, was Sie senden, nicht dessen, was zurückkommt. Um Modell-Antworten heute zu gaten, wird eine Output-block-Regel in beiden Wegen durchgesetzt — siehe Output-Stage-Regeln und Streaming-Abdeckung.

2. Das Preset in der Konsole anwenden

Jeder Schritt hier ist eine Konsolen-Aktion auf dem gehosteten Gateway unter Ihrer eigenen Session. Das Erstellen und Bearbeiten von Guardrails erfordert Developer+ im Workspace. Nur der finale /v1/*-Aufruf verwendet einen sk-orca-...-Relay-Key.

Das Template öffnen

Öffnen Sie in der Konsole Guardrails, klicken Sie auf den New guardrail-Splitbutton und wählen Sie PII Shield aus der PII-Template-Kategorie. Es legt eine einzelne maskierende pii-Regel an.

Benennen und speichern

Geben Sie ihm einen Namen (≤ 64 Zeichen), z. B. pii-shield, und speichern Sie. Ein Preset ist ein Keim, keine Sperre — bearbeiten Sie die Entity-Liste oder Action danach frei.

Es testen

Öffnen Sie den Tab Test, fügen Sie ein Sample an der input-Stage ein und führen Sie die Policy lokal aus — kein Upstream-Aufruf, kein Kontingent (siehe §4).

Einen Key anhängen

Bearbeiten Sie einen API-Key und wählen Sie pii-shield aus dem Dropdown Guardrail (setzt guardrail_id auf dem Key) oder markieren Sie es als Workspace-Default. Siehe An einen Key anhängen und Account-Default.

3. Was maskiert wird, und wozu

Bei einer mask-Action wird jeder Treffer durch einen typisierten Tag ersetzt — aus einer E-Mail wird [EMAIL], aus einer SSN wird [SSN]. Der eingebaute Detektor-Satz ist geschlossen und wird von der Engine, der Sandbox und dem Rule-Builder gemeinsam genutzt:

Eingebaute Entities

email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.

Regionale Identifier

jp_mynumber (Japan My Number → [JP_MYNUMBER]), kr_rrn (Korea RRN → [KR_RRN]) und cn_resident_id (China Resident ID → [CN_RESIDENT_ID]). Aktivieren Sie diejenigen, die zu Ihrer Jurisdiktion passen.

Ihre eigenen benutzerdefinierten Entities

Schichten Sie einen Regex-Detektor über die eingebauten — eine employee_id, eine interne Kontonummer — mit einer optionalen luhn-Prüfsumme und einem benutzerdefinierten Ersatz. Bis zu 25 pro Regel. Siehe Benutzerdefinierte PII-Entities und Masking-Formate.

Eine PII-Regel kann verschiedene Actions auf verschiedene Entities anwenden, via entity_actions — email / phone / ip maskieren, aber bei credit_card oder ssn blockieren. Keine überlappenden Regeln nötig. Siehe Actions.

4. Vor dem Anhängen testen

Beweisen Sie, dass die Regel tut, was Sie erwarten, bevor irgendein Key auf sie zeigt. Öffnen Sie den Tab Test im Editor, fügen Sie ein Sample ein, wählen Sie die input-Stage und führen Sie aus:

Reply to jane@acme.com please

Die Sandbox evaluiert die aktuelle Policy lokal und gibt das Verdikt plus den gerenderten Text zurück — nichts wird nach Upstream gesendet, nichts gemessen:

Reply to [EMAIL] please

Für ein A/B-Raster gegen einen Korpus liegt das Eval-Harness einen Tab weiter.

5. Einen Request senden

Mit einem an pii-shield gebundenen Key rufen Sie OrcaRouter genau wie zuvor auf — keine neuen Header, keine SDK-Änderung:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

Das Gateway maskiert die E-Mail vor dem Weiterleiten zu [EMAIL] — das Upstream-Modell empfängt Reply to [EMAIL] please und sieht die Adresse nie.

Tauschen Sie die Action einer Entity zu block (via Pro-Entity-Override), und der allernächste Request, der diese Entity trägt, wird mit HTTP 400 guardrail_blocked abgelehnt. Ein blockierter Request kostet kein Kontingent (ein Input-Block feuert vor der Messung) und wird als skip-retry markiert. Siehe den guardrail_blocked-Fehler.

6. Sehen, was gefeuert hat

Jede Regel, die feuert, zeichnet einen Match auf — Regeltyp, Action, Stage und einen Detail-String — zur Oberfläche gebracht im Workspace-Matches-Feed. Der gematchte Teilstring selbst (die tatsächliche E-Mail-Adresse) wird nur aufgezeichnet, wenn Log raw content an ist, was standardmäßig aus ist — die datenschutzfreundliche Haltung, die redigierte PII auch aus Ihrer eigenen Telemetrie heraushält.

Für eine Redaktions-Kontrolle ist es meist genau der Punkt, Log raw content aus zu lassen: Sie sehen, dass eine email maskiert wurde und wie oft, ohne den Wert, den Sie gerade gescrubbt haben, erneut zu erfassen. Schalten Sie es pro Guardrail nur ein, wenn Sie den Teilstring zum Triage brauchen; die Einstellung ist nicht rückwirkend. Siehe Matches-Feed und Logging & Datenschutz.

7. Wohin als Nächstes

Benutzerdefinierte PII-Entities

Fügen Sie Ihre eigenen Regex-Detektoren mit optionalen Luhn-Prüfungen hinzu, bis zu 25 pro Regel.

Masking-Formate

Steuern Sie den typisierten Tag, zu dem jede Entity rendert.

Secrets blockieren

Fangen Sie API-Keys und Credentials mit dem Secrets-Blocker-Preset ab.

Fehlalarme tunen

Markieren Sie Fehlalarme und verschärfen Sie Detektoren aus dem Matches-Feed.

PII Shield maskiert Inhalte. Um die Tool-Calls eines Agenten zu steuern — destruktive Aktionen verweigern, Tool-Call-Argumente redigieren, Freigabe verlangen — verwenden Sie die Firewall. Beginnen Sie mit KI-Agenten absichern und der Daten-Exfiltrations-Bedrohung, oder lesen Sie die Guardrails-Referenz für die vollständige Engine.

​1. PII-Redaktion mit LLM in einer Regel

​2. Das Preset in der Konsole anwenden

​3. Was maskiert wird, und wozu

​4. Vor dem Anhängen testen

​5. Einen Request senden

​6. Sehen, was gefeuert hat

​7. Wohin als Nächstes

Benutzerdefinierte PII-Entities

Masking-Formate

Secrets blockieren

Fehlalarme tunen

1. PII-Redaktion mit LLM in einer Regel

2. Das Preset in der Konsole anwenden

3. Was maskiert wird, und wozu

4. Vor dem Anhängen testen

5. Einen Request senden

6. Sehen, was gefeuert hat

7. Wohin als Nächstes