Редактируйте PII с PII Shield

Вы хотите держать персональные данные вне вышестоящей модели. Клиент вставляет адрес email, транскрипт поддержки несёт номер карты, промпт агента сливает SSN — и ничего из этого не должно дойти до OpenAI, Anthropic или Google в открытом виде. PII Shield — самый быстрый способ это исправить: пресет guardrail из одного правила, который детектирует чувствительные сущности в запросе и маскирует каждую в типизированный тег до того, как шлюз перешлёт вызов. Это сфокусированная посадочная страница для сценария маскирования PII. Полный движок guardrail — каждый тип правила, поле и маршрут — см. в справочнике Guardrails.

1. Сценарий редактирования PII для LLM в одном правиле

Сложная часть сантехники pii redaction llm — обычно сама сантехника. PII Shield её убирает. Пресет — это единственное правило pii:

Тип: PII detection (pii)
Действие: Mask — заменить каждое совпадение типизированным тегом
Сущности: email, phone, ssn, credit_card, ip

Примените его один раз в консоли, привяжите к ключу — и каждый вызов на этом ключе проверяется без изменения SDK и без передеплоя. Политика живёт в шлюзе, а не в вашем приложении — ваше приложение продолжает вызывать /v1/chat/completions ровно как раньше.

Маскирование на стадии input — живой путь. PII Shield маскирует запрос до того, как он покинет шлюз, так что вышестоящая модель никогда не видит исходное значение. Живое маскирование вывода модели и стримированных ответов в дорожной карте; представляйте PII Shield как очистку того, что вы отправляете, а не того, что приходит обратно. Чтобы шлюзовать ответы модели сегодня, правило output block применяется в обоих случаях — см. Правила стадии output и Покрытие стриминга.

2. Примените пресет в консоли

Каждый шаг здесь — действие консоли на хостед-шлюзе под вашей собственной сессией. Создание и редактирование guardrails требует Developer+ в рабочем пространстве. Только финальный вызов /v1/* использует relay-ключ sk-orca-....

Откройте шаблон

В консоли откройте Guardrails, нажмите split-кнопку New guardrail и выберите PII Shield из категории шаблонов PII. Это засевает единственное маскирующее правило pii.

Назовите и сохраните

Дайте ему имя (≤ 64 символов), например pii-shield, и сохраните. Пресет — это семя, а не замок — после редактируйте список сущностей или действие свободно.

Протестируйте

Откройте вкладку Test, вставьте образец на стадии input и прогоните политику локально — без вышестоящего вызова, без квоты (см. §4).

Привяжите ключ

Отредактируйте API-ключ и выберите pii-shield из выпадающего списка Guardrail (устанавливает guardrail_id на ключе) или пометьте его default’ом рабочего пространства. См. Привязка к ключу и Default аккаунта.

3. Что маскируется и во что

При действии mask каждое совпадение заменяется типизированным тегом — email становится [EMAIL], SSN становится [SSN]. Набор встроенных детекторов закрыт и разделяется движком, песочницей и конструктором правил:

Встроенные сущности

email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.

Региональные идентификаторы

jp_mynumber (Japan My Number → [JP_MYNUMBER]), kr_rrn (Korea RRN → [KR_RRN]) и cn_resident_id (China resident ID → [CN_RESIDENT_ID]). Включите те, что соответствуют вашей юрисдикции.

Ваши собственные пользовательские сущности

Наслоите regex-детектор поверх встроенных — employee_id, внутренний номер аккаунта — с опциональной контрольной суммой luhn и пользовательской заменой. До 25 на правило. См. Пользовательские сущности PII и Форматы маскирования.

Одно правило PII может применять разные действия к разным сущностям через entity_actions — маскировать email / phone / ip, но блокировать на credit_card или ssn. Не нужно перекрывающихся правил. См. Действия.

4. Протестируйте перед привязкой

Докажите, что правило делает то, что вы ожидаете, прежде чем на него укажет любой ключ. Откройте вкладку Test внутри редактора, вставьте образец, выберите стадию input и запустите:

Reply to jane@acme.com please

Песочница оценивает текущую политику локально и возвращает вердикт плюс отрендеренный текст — ничего не отправляется вышестоящей системе, ничего не тарифицируется:

Reply to [EMAIL] please

Для A/B-сетки против корпуса eval-харнесс живёт одной вкладкой дальше.

5. Отправьте запрос

Используя ключ, привязанный к pii-shield, вызовите OrcaRouter ровно как раньше — без новых заголовков, без изменения SDK:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

Шлюз маскирует email в [EMAIL] перед пересылкой — вышестоящая модель получает Reply to [EMAIL] please и никогда не видит адрес.

Смените действие сущности на block (через переопределение по сущности), и уже следующий запрос, несущий эту сущность, отклоняется с HTTP 400 guardrail_blocked. Заблокированный запрос не стоит квоты (блокировка input срабатывает до тарификации) и помечается skip-retry. См. ошибку guardrail_blocked.

6. Посмотрите, что сработало

Каждое сработавшее правило записывает совпадение — тип правила, действие, стадию и строку-деталь — всплывающее в ленте Matches рабочего пространства. Сама совпавшая подстрока (фактический адрес email) записывается только, когда включён Log raw content, который по умолчанию выключен — консервативная по приватности позиция, которая держит отредактированную PII вне вашей собственной телеметрии тоже.

Для контроля редактирования оставить Log raw content выключенным обычно и есть смысл: вы можете видеть, что email был замаскирован и как часто, не перезахватывая значение, которое только что очистили. Включайте его для каждого guardrail только когда подстрока нужна для сортировки; настройка не ретроактивна. См. Ленту Matches и Логирование и приватность.

7. Куда двигаться дальше

Пользовательские сущности PII

Добавьте собственные regex-детекторы с опциональными проверками Luhn, до 25 на правило.

Форматы маскирования

Контролируйте типизированный тег, в который рендерится каждая сущность.

Блокировка секретов

Ловите API-ключи и учётные данные пресетом Secrets Blocker.

Настройка ложных срабатываний

Помечайте ложные срабатывания и ужесточайте детекторы из ленты Matches.

PII Shield маскирует содержимое. Чтобы управлять вызовами инструментов агента — запрещать деструктивные действия, редактировать аргументы вызовов инструментов, требовать подтверждения — используйте Firewall. Начните с Защиты ИИ-агентов и угрозы эксфильтрации данных или прочтите справочник Guardrails для полного движка.

Ошибка guardrail_blocked Пользовательские сущности PII

​1. Сценарий редактирования PII для LLM в одном правиле

​2. Примените пресет в консоли

​3. Что маскируется и во что

​4. Протестируйте перед привязкой

​5. Отправьте запрос

​6. Посмотрите, что сработало

​7. Куда двигаться дальше

Пользовательские сущности PII

Форматы маскирования

Блокировка секретов

Настройка ложных срабатываний

1. Сценарий редактирования PII для LLM в одном правиле

2. Примените пресет в консоли

3. Что маскируется и во что

4. Протестируйте перед привязкой

5. Отправьте запрос

6. Посмотрите, что сработало

7. Куда двигаться дальше