1. Przypadek redakcji PII LLM w jednej regule
Trudną częścią orurowaniapii redaction llm jest zwykle orurowanie. PII
Shield je usuwa. Preset to pojedyncza reguła pii:
- Typ: Wykrywanie PII (
pii) - Akcja: Mask — zastąp każde dopasowanie typowanym tagiem
- Encje:
email,phone,ssn,credit_card,ip
/v1/chat/completions dokładnie jak wcześniej.
Maskowanie na etapie wejścia to ścieżka żywa. PII Shield maskuje
żądanie, zanim opuści bramę, więc model nadrzędny nigdy nie widzi
oryginalnej wartości. Żywe maskowanie wyjścia modelu i odpowiedzi
strumieniowanych jest w planach; ujmuj PII Shield jako czyszczenie tego, co
wysyłasz, nie tego, co wraca. Aby bramkować odpowiedzi modelu już dziś,
reguła block wyjścia jest egzekwowana w obie strony — zobacz
Reguły na etapie wyjścia i
Pokrycie streamingu.
2. Zastosuj preset w konsoli
Każdy krok tutaj to akcja konsoli na hostowanej bramie pod twoją własną sesją. Tworzenie i edycja guardrails wymaga Developer+ w przestrzeni roboczej. Tylko końcowe wywołanie/v1/* używa klucza relay sk-orca-....
Otwórz szablon
W konsoli otwórz Guardrails, kliknij przycisk z podziałem New
guardrail i wybierz PII Shield z kategorii szablonów PII.
Zasiewa pojedynczą maskującą regułę
pii.Nazwij i zapisz
Nadaj mu nazwę (≤ 64 znaki), np.
pii-shield, i zapisz. Preset to
ziarno, nie blokada — edytuj listę encji lub akcję swobodnie potem.Przetestuj
Otwórz zakładkę Test, wklej próbkę na etapie
input i uruchom
politykę lokalnie — bez wywołania w górę, bez kwoty (zobacz
§4).Powiąż klucz
Edytuj klucz API i wybierz
pii-shield z rozwijanej listy Guardrail
(ustawia guardrail_id na kluczu) lub oznacz go jako domyślny
przestrzeni roboczej. Zobacz
Powiąż z kluczem i
Domyślny dla konta.3. Co jest maskowane i na co
Przy akcji mask każde dopasowanie jest zastępowane typowanym tagiem — email staje się[EMAIL], SSN staje się [SSN]. Wbudowany zestaw detektorów
jest zamknięty i współdzielony przez silnik, piaskownicę i konstruktor reguł:
Wbudowane encje
Wbudowane encje
email, phone, credit_card, ssn, ip, iban, mac_address,
jwt, aws_access_key, api_key_openai, bitcoin_address.Identyfikatory regionalne
Identyfikatory regionalne
jp_mynumber (japoński My Number → [JP_MYNUMBER]), kr_rrn (koreański
RRN → [KR_RRN]) oraz cn_resident_id (chiński dowód mieszkańca →
[CN_RESIDENT_ID]). Włącz te, które pasują do twojej jurysdykcji.Twoje własne niestandardowe encje
Twoje własne niestandardowe encje
Nawarstwij detektor regex na wbudowanych —
employee_id, wewnętrzny
numer konta — z opcjonalną sumą kontrolną luhn i niestandardowym
zamiennikiem. Do 25 na regułę. Zobacz
Niestandardowe encje PII i
Formaty maskowania.4. Przetestuj, zanim powiążesz
Udowodnij, że reguła robi to, czego oczekujesz, zanim jakikolwiek klucz na nią wskaże. Otwórz zakładkę Test wewnątrz edytora, wklej próbkę, wybierz etapinput i uruchom:
5. Wyślij żądanie
Używając klucza powiązanego zpii-shield, wywołaj OrcaRouter dokładnie jak
wcześniej — bez nowych nagłówków, bez zmiany SDK:
[EMAIL] przed przesłaniem — model nadrzędny
otrzymuje Reply to [EMAIL] please i nigdy nie widzi adresu.
6. Zobacz, co zadziałało
Każda reguła, która zadziała, rejestruje dopasowanie — typ reguły, akcję, etap i łańcuch szczegółów — pokazane w strumieniu Matches przestrzeni roboczej. Sam dopasowany podłańcuch (faktyczny adres email) jest rejestrowany tylko, gdy Log raw content jest włączone, co jest domyślnie wyłączone — postawa konserwatywna wobec prywatności, która trzyma zredagowane PII też z dala od twojej własnej telemetrii.Dla kontroli redakcji pozostawienie Log raw content wyłączonego jest
zwykle sednem: widzisz, że
email został zamaskowany i jak często, bez
ponownego przechwytywania wartości, którą właśnie wyczyściłeś. Włącz to per
guardrail tylko, gdy potrzebujesz podłańcucha do triażu; ustawienie nie działa
wstecznie. Zobacz Strumień dopasowań i
Logowanie i prywatność.7. Dokąd dalej
Niestandardowe encje PII
Dodaj własne detektory regex z opcjonalnymi sprawdzeniami Luhna, do 25 na regułę.
Formaty maskowania
Kontroluj typowany tag, na który renderuje się każda encja.
Blokuj sekrety
Wychwyć klucze API i poświadczenia presetem Secrets Blocker.
Strojenie fałszywie pozytywnych
Oznaczaj fałszywie pozytywne i zacieśniaj detektory ze strumienia Matches.
