Перейти к основному содержанию
Когда правило guardrail срабатывает, OrcaRouter записывает совпадение, чтобы вы могли видеть, что задело и как часто. Вопрос приватности — тот, на который отвечает эта страница: содержит ли эта запись фактический чувствительный текст — реальный email, SSN, API-ключ — или только факт, что правило совпало? По умолчанию она содержит только факт. Приватное логирование guardrail на хостед-шлюзе консервативно нарочно: совпавшая подстрока не хранится, пока вы явно не включите Log raw content для этого guardrail, и переключение никогда не дотягивается назад до данных, которые вы уже залогировали. Это сфокусированная посадочная страница для позиции приватности ленты Matches. Саму ленту — просмотр, группировка, экспорт — см. в Ленте Matches. Для полного движка см. справочник Guardrails.

1. Приватное логирование guardrail: по умолчанию выключено

Каждый guardrail несёт единственный переключатель на политику, Log raw content, и он поставляется выключенным. С ним выключенным совпадение записывает метаданные того, что сработало, но никогда не копирует нарушающий текст в ленту:

Записывается с переключателем ВЫКЛ

Тип правила, действие, стадия и короткая строка-деталь — достаточно, чтобы знать, что правило pii замаскировало email в запросе, не храня адрес.

Добавляется только когда ВКЛ

Совпавшая(ие) подстрока(и) — литеральный текст, который поймало правило. Захватывается только для совпадений, записанных после того, как вы включите переключатель.
Обоснование — то, которое большинство команд комплаенса хотят по умолчанию: вы узнаёте, что SSN появился в вашем трафике и как политика с ним обошлась, не копируя регулируемые данные обратно из запроса в ваше собственное диагностическое хранилище.
Выключено по умолчанию — это консервативная по приватности позиция. Совпавшая подстрока — самое чувствительное, что guardrail мог бы залогировать — это, по определению, данные, ради ловли которых правило существует. OrcaRouter не хранит её, пока вы не согласитесь для каждого guardrail.

2. Что держит запись совпадения

Совпадение — это маленькая диагностическая запись, ограниченная рабочим пространством. С Log raw content выключенным она несёт только метаданные:
ПолеПримерПрисутствует с переключателем выкл?
Тип правилаpii, regex, keywordДа
Действиеblock, mask, flagДа
Стадияinput, outputДа
Деталькороткая строка-классификатор (например, сущность)Да
Совпавшая подстрокаjane@acme.comТолько когда ВКЛ
Поле совпавшей подстроки — единственное, что шлюзует переключатель. Всё остальное записывается в любом случае, так что лента полезна для анализа объёма, тренда и набора действий даже с выключенным сырым содержимым.
Вы можете провести целую программу наблюдения-или-применения — увидеть, где входит PII, какие правила срабатывают чаще, шумит ли политика — чисто на метаданных. Включайте подстроку только для узкого окна, где вам нужно взглянуть именно на то, что совпало во время сортировки.

3. Один конкретный пример

Возьмите guardrail с правилом pii, которое маскирует email в запросе, привязанный к ключу. Вызывающий отправляет:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
Правило маскирует адрес в [EMAIL] до того, как модель его увидит, и совпадение попадает в ленту. Что это совпадение содержит, зависит целиком от переключателя:
Совпадение записывает: тип правила pii, действие mask, стадия input и строку-деталь, называющую сущность email. Оно не хранит jane@acme.com. Вы знаете, что email был замаскирован в запросе; вы не можете прочитать email обратно из ленты.
То же совпадение дополнительно несёт совпавшую подстроку — jane@acme.com — так что вы можете точно подтвердить, что правило поймало, во время прохода сортировки.
Сам запрос идентичен в обоих случаях. Переключатель меняет только то, что удерживает диагностическая лента, никогда то, что испытывает вызывающий или вышестоящая модель.

4. Включение (и гарантия неретроактивности)

Log raw content — настройка для каждого guardrail. Редактирование guardrail — действие консоли под вашей собственной сессией и требует Developer+ в рабочем пространстве — только финальный вызов /v1/* использует relay-ключ sk-orca-....
1

Откройте guardrail

В консоли откройте Guardrails и отредактируйте политику, для которой хотите захватывать подстроки.
2

Включите Log raw content

Включите переключатель Log raw content и сохраните. Сохранение пишет версионированную строку истории, так что изменение проверяемо и откатываемо — см. Версионирование.
3

Захват начинается с этого момента

С следующего запроса и далее совпадения на этом guardrail включают совпавшую подстроку. Совпадения, записанные до того, как вы переключили рычаг, остаются только метаданными.
Переключатель не ретроактивен — в обе стороны. Включение его ВКЛ не дозаполняет подстроки на совпадения, которые вы уже залогировали; те более старые записи остаются только метаданными навсегда. Выключение его ВЫКЛ останавливает захват новых подстрок, но не стирает подстроки, уже сохранённые на прошлых совпадениях. Если вам нужно, чтобы их не было, см. §6.

5. Что захватывается, когда он включён

Когда Log raw content включён, движок прикрепляет литеральный совпавший текст к каждому нарушению, с двумя жёсткими лимитами, которые держат один патологический ввод от раздувания одной записи совпадения:
  • Максимум 32 совпавших записи на нарушение.
  • Каждая запись ограничена 256 символами.
Так что guardrail, который срабатывает на огромном документе, хранит ограниченный репрезентативный образец того, что совпало — а не всё тело. Строка-деталь независимо ограничена по длине тоже. Эти лимиты существуют для гигиены хранения; трактуйте захваченный набор как доказательство того, что совпало, а не дословный транскрипт всего запроса.
Даже с включённым переключателем guardrail когда-либо записывает только текст, который правило реально совпало. Окружающий промпт и остальной ответ никогда не копируются в ленту Matches. Полные полезные нагрузки запроса/ответа — отдельная забота от диагностики guardrail.

6. Удаление подстрок, которые вы уже захватили

Поскольку переключатель не ретроактивен, выключение его оставляет прежние подстроки на месте. Две поверхности их очищают:
Хотите удалитьКак
Одно шумное совпадениеПометьте его ложным срабатыванием — POST /api/guardrail/match/:id/mark-fp (Admin рабочего пространства) или действие Mark false positive в ленте.
Все совпадения guardrail для пользователяСамоудаление пользователя запускает 30-дневное окно отсрочки, затем очистку PII, которая каскадирует через совпадения guardrail, логи запросов и события firewall. См. Compliance.
Для настройки болтливого правила, а не очистки данных, поток Настройки ложных срабатываний проводит через пометку и уточнение совпадений.

7. Кто что может читать

Лента Matches — диагностические данные, ограниченные рабочим пространством. Доступ на чтение открыт каждому активному участнику; деструктивное действие ложного срабатывания шлюзовано выше:
ДействиеМаршрутРоль
Список / группировка / статистика / экспорт совпаденийGET /api/guardrail/match*Member
Детали одного совпаденияGET /api/guardrail/match/:idMember
Пометить / снять пометку ложного срабатыванияPOST / DELETE /api/guardrail/match/:id/mark-fpAdmin
Редактировать guardrail (вкл. Log raw content)PUT /api/guardrail/Developer+
Эти маршруты управления аутентифицируются вашей сессией консоли, а не relay-ключом. Чтения никогда не раскрывают подстроку, которую переключатель не захватил — нет ничего лишнего для редактирования при чтении, потому что ничего лишнего не было сохранено.

8. Практичный дефолт приватности

Для большинства рабочих пространств правильная форма такая: оставьте Log raw content выключенным, прогоняйте ваши guardrails на метаданных и включайте переключатель временно для одной политики, когда вы активно отлаживаете, почему правило срабатывает так, как срабатывает. Затем выключите его обратно — новые совпадения немедленно перестают нести подстроки.
Это естественно сочетается с развёртыванием только наблюдения. Начните с Compliance Logger (только flag), понаблюдайте за лентой Matches на метаданных, и тянитесь к сырому содержимому только если конкретное совпадение нуждается в более близком взгляде.

9. Куда двигаться дальше

Лента Matches

Просматривайте, группируйте, фильтруйте и экспортируйте каждое записанное совпадение.

Настройка ложных срабатываний

Помечайте и уточняйте совпадения, чтобы утихомирить шумное правило.

Версионирование

Каждое переключение рычага — версионированное, откатываемое изменение.

Compliance

Хранение, удаление данных субъекта и подписанные отчёты.
О том, как это вписывается в более широкий стек управления, см. Guardrails vs firewall и Эксфильтрацию данных. Для полного движка — стадии, продвинутые правила и маршруты — прочтите справочник Guardrails.