Przejdź do głównej treści
Chcesz trzymać dane osobowe z dala od modelu nadrzędnego. Klient wkleja adres email, transkrypt wsparcia niesie numer karty, prompt agenta wycieka SSN — i nic z tego nie powinno dotrzeć do OpenAI, Anthropic czy Google w postaci jawnej. PII Shield to najszybszy sposób, by to naprawić: jednoregułowy preset guardrail, który wykrywa wrażliwe encje w żądaniu i maskuje każdą z nich do typowanego tagu, zanim brama prześle wywołanie. To skupiona strona docelowa dla przypadku maskowania PII. Pełny silnik guardrail — każdy typ reguły, pole i trasę — znajdziesz w referencji Guardrails.

1. Przypadek redakcji PII LLM w jednej regule

Trudną częścią orurowania pii redaction llm jest zwykle orurowanie. PII Shield je usuwa. Preset to pojedyncza reguła pii:
  • Typ: Wykrywanie PII (pii)
  • Akcja: Mask — zastąp każde dopasowanie typowanym tagiem
  • Encje: email, phone, ssn, credit_card, ip
Zastosuj go raz w konsoli, powiąż z kluczem, a każde wywołanie tym kluczem jest sprawdzane bez zmiany SDK i bez ponownego wdrożenia. Polityka żyje w bramie, nie w twojej aplikacji — twoja aplikacja dalej woła /v1/chat/completions dokładnie jak wcześniej.
Maskowanie na etapie wejścia to ścieżka żywa. PII Shield maskuje żądanie, zanim opuści bramę, więc model nadrzędny nigdy nie widzi oryginalnej wartości. Żywe maskowanie wyjścia modelu i odpowiedzi strumieniowanych jest w planach; ujmuj PII Shield jako czyszczenie tego, co wysyłasz, nie tego, co wraca. Aby bramkować odpowiedzi modelu już dziś, reguła block wyjścia jest egzekwowana w obie strony — zobacz Reguły na etapie wyjścia i Pokrycie streamingu.

2. Zastosuj preset w konsoli

Każdy krok tutaj to akcja konsoli na hostowanej bramie pod twoją własną sesją. Tworzenie i edycja guardrails wymaga Developer+ w przestrzeni roboczej. Tylko końcowe wywołanie /v1/* używa klucza relay sk-orca-....
1

Otwórz szablon

W konsoli otwórz Guardrails, kliknij przycisk z podziałem New guardrail i wybierz PII Shield z kategorii szablonów PII. Zasiewa pojedynczą maskującą regułę pii.
2

Nazwij i zapisz

Nadaj mu nazwę (≤ 64 znaki), np. pii-shield, i zapisz. Preset to ziarno, nie blokada — edytuj listę encji lub akcję swobodnie potem.
3

Przetestuj

Otwórz zakładkę Test, wklej próbkę na etapie input i uruchom politykę lokalnie — bez wywołania w górę, bez kwoty (zobacz §4).
4

Powiąż klucz

Edytuj klucz API i wybierz pii-shield z rozwijanej listy Guardrail (ustawia guardrail_id na kluczu) lub oznacz go jako domyślny przestrzeni roboczej. Zobacz Powiąż z kluczem i Domyślny dla konta.

3. Co jest maskowane i na co

Przy akcji mask każde dopasowanie jest zastępowane typowanym tagiem — email staje się [EMAIL], SSN staje się [SSN]. Wbudowany zestaw detektorów jest zamknięty i współdzielony przez silnik, piaskownicę i konstruktor reguł:
email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.
jp_mynumber (japoński My Number → [JP_MYNUMBER]), kr_rrn (koreański RRN → [KR_RRN]) oraz cn_resident_id (chiński dowód mieszkańca → [CN_RESIDENT_ID]). Włącz te, które pasują do twojej jurysdykcji.
Nawarstwij detektor regex na wbudowanych — employee_id, wewnętrzny numer konta — z opcjonalną sumą kontrolną luhn i niestandardowym zamiennikiem. Do 25 na regułę. Zobacz Niestandardowe encje PII i Formaty maskowania.
Jedna reguła PII może stosować różne akcje do różnych encji przez entity_actions — maskuj email / phone / ip, ale blokuj na credit_card lub ssn. Bez potrzeby nakładających się reguł. Zobacz Akcje.

4. Przetestuj, zanim powiążesz

Udowodnij, że reguła robi to, czego oczekujesz, zanim jakikolwiek klucz na nią wskaże. Otwórz zakładkę Test wewnątrz edytora, wklej próbkę, wybierz etap input i uruchom:
Reply to jane@acme.com please
Piaskownica ewaluuje bieżącą politykę lokalnie i zwraca werdykt oraz wyrenderowany tekst — nic nie jest wysyłane w górę, nic mierzone:
Reply to [EMAIL] please
Po siatkę A/B wobec korpusu harness ewaluacyjny mieszka o jedną zakładkę dalej.

5. Wyślij żądanie

Używając klucza powiązanego z pii-shield, wywołaj OrcaRouter dokładnie jak wcześniej — bez nowych nagłówków, bez zmiany SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
Brama maskuje email do [EMAIL] przed przesłaniem — model nadrzędny otrzymuje Reply to [EMAIL] please i nigdy nie widzi adresu.
Zamień akcję encji na block (przez nadpisanie per-encja), a kolejne żądanie niosące tę encję jest odrzucane z HTTP 400 guardrail_blocked. Zablokowane żądanie nie kosztuje kwoty (blokada wejścia działa przed pomiarem) i jest oznaczone jako skip-retry. Zobacz błąd guardrail_blocked.

6. Zobacz, co zadziałało

Każda reguła, która zadziała, rejestruje dopasowanie — typ reguły, akcję, etap i łańcuch szczegółów — pokazane w strumieniu Matches przestrzeni roboczej. Sam dopasowany podłańcuch (faktyczny adres email) jest rejestrowany tylko, gdy Log raw content jest włączone, co jest domyślnie wyłączone — postawa konserwatywna wobec prywatności, która trzyma zredagowane PII też z dala od twojej własnej telemetrii.
Dla kontroli redakcji pozostawienie Log raw content wyłączonego jest zwykle sednem: widzisz, że email został zamaskowany i jak często, bez ponownego przechwytywania wartości, którą właśnie wyczyściłeś. Włącz to per guardrail tylko, gdy potrzebujesz podłańcucha do triażu; ustawienie nie działa wstecznie. Zobacz Strumień dopasowań i Logowanie i prywatność.

7. Dokąd dalej

Niestandardowe encje PII

Dodaj własne detektory regex z opcjonalnymi sprawdzeniami Luhna, do 25 na regułę.

Formaty maskowania

Kontroluj typowany tag, na który renderuje się każda encja.

Blokuj sekrety

Wychwyć klucze API i poświadczenia presetem Secrets Blocker.

Strojenie fałszywie pozytywnych

Oznaczaj fałszywie pozytywne i zacieśniaj detektory ze strumienia Matches.
PII Shield maskuje treść. Aby rządzić wywołaniami narzędzi agenta — odmawiać akcji destrukcyjnych, redagować argumenty wywołań narzędzi, wymagać zatwierdzenia — użyj Firewalla. Zacznij od Zabezpieczania agentów AI i zagrożenia eksfiltracji danych albo przeczytaj referencję Guardrails po kompletny silnik.