1. Сценарий редактирования PII для LLM в одном правиле
Сложная часть сантехникиpii redaction llm — обычно сама сантехника.
PII Shield её убирает. Пресет — это единственное правило pii:
- Тип: PII detection (
pii) - Действие: Mask — заменить каждое совпадение типизированным тегом
- Сущности:
email,phone,ssn,credit_card,ip
/v1/chat/completions ровно как раньше.
Маскирование на стадии input — живой путь. PII Shield маскирует
запрос до того, как он покинет шлюз, так что вышестоящая модель
никогда не видит исходное значение. Живое маскирование вывода
модели и стримированных ответов в дорожной карте; представляйте PII
Shield как очистку того, что вы отправляете, а не того, что приходит
обратно. Чтобы шлюзовать ответы модели сегодня, правило output
block применяется в обоих случаях — см.
Правила стадии output и
Покрытие стриминга.
2. Примените пресет в консоли
Каждый шаг здесь — действие консоли на хостед-шлюзе под вашей собственной сессией. Создание и редактирование guardrails требует Developer+ в рабочем пространстве. Только финальный вызов/v1/*
использует relay-ключ sk-orca-....
Откройте шаблон
В консоли откройте Guardrails, нажмите split-кнопку New
guardrail и выберите PII Shield из категории шаблонов PII.
Это засевает единственное маскирующее правило
pii.Назовите и сохраните
Дайте ему имя (≤ 64 символов), например
pii-shield, и сохраните.
Пресет — это семя, а не замок — после редактируйте список сущностей
или действие свободно.Протестируйте
Откройте вкладку Test, вставьте образец на стадии
input и
прогоните политику локально — без вышестоящего вызова, без квоты (см.
§4).Привяжите ключ
Отредактируйте API-ключ и выберите
pii-shield из выпадающего списка
Guardrail (устанавливает guardrail_id на ключе) или пометьте
его default’ом рабочего пространства. См.
Привязка к ключу и
Default аккаунта.3. Что маскируется и во что
При действии mask каждое совпадение заменяется типизированным тегом — email становится[EMAIL], SSN становится [SSN]. Набор встроенных
детекторов закрыт и разделяется движком, песочницей и конструктором
правил:
Встроенные сущности
Встроенные сущности
email, phone, credit_card, ssn, ip, iban,
mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address.Региональные идентификаторы
Региональные идентификаторы
jp_mynumber (Japan My Number → [JP_MYNUMBER]), kr_rrn (Korea
RRN → [KR_RRN]) и cn_resident_id (China resident ID →
[CN_RESIDENT_ID]). Включите те, что соответствуют вашей
юрисдикции.Ваши собственные пользовательские сущности
Ваши собственные пользовательские сущности
Наслоите regex-детектор поверх встроенных —
employee_id,
внутренний номер аккаунта — с опциональной контрольной суммой luhn
и пользовательской заменой. До 25 на правило. См.
Пользовательские сущности PII и
Форматы маскирования.4. Протестируйте перед привязкой
Докажите, что правило делает то, что вы ожидаете, прежде чем на него укажет любой ключ. Откройте вкладку Test внутри редактора, вставьте образец, выберите стадиюinput и запустите:
5. Отправьте запрос
Используя ключ, привязанный кpii-shield, вызовите OrcaRouter ровно
как раньше — без новых заголовков, без изменения SDK:
[EMAIL] перед пересылкой — вышестоящая модель
получает Reply to [EMAIL] please и никогда не видит адрес.
6. Посмотрите, что сработало
Каждое сработавшее правило записывает совпадение — тип правила, действие, стадию и строку-деталь — всплывающее в ленте Matches рабочего пространства. Сама совпавшая подстрока (фактический адрес email) записывается только, когда включён Log raw content, который по умолчанию выключен — консервативная по приватности позиция, которая держит отредактированную PII вне вашей собственной телеметрии тоже.Для контроля редактирования оставить Log raw content выключенным
обычно и есть смысл: вы можете видеть, что
email был замаскирован и
как часто, не перезахватывая значение, которое только что очистили.
Включайте его для каждого guardrail только когда подстрока нужна для
сортировки; настройка не ретроактивна. См.
Ленту Matches и
Логирование и приватность.7. Куда двигаться дальше
Пользовательские сущности PII
Добавьте собственные regex-детекторы с опциональными проверками Luhn,
до 25 на правило.
Форматы маскирования
Контролируйте типизированный тег, в который рендерится каждая
сущность.
Блокировка секретов
Ловите API-ключи и учётные данные пресетом Secrets Blocker.
Настройка ложных срабатываний
Помечайте ложные срабатывания и ужесточайте детекторы из ленты
Matches.
