1. Приватное логирование guardrail: по умолчанию выключено
Каждый guardrail несёт единственный переключатель на политику, Log raw content, и он поставляется выключенным. С ним выключенным совпадение записывает метаданные того, что сработало, но никогда не копирует нарушающий текст в ленту:Записывается с переключателем ВЫКЛ
Тип правила, действие, стадия и короткая строка-деталь — достаточно,
чтобы знать, что правило
pii замаскировало email в запросе, не
храня адрес.Добавляется только когда ВКЛ
Совпавшая(ие) подстрока(и) — литеральный текст, который поймало
правило. Захватывается только для совпадений, записанных после того,
как вы включите переключатель.
Выключено по умолчанию — это консервативная по приватности позиция.
Совпавшая подстрока — самое чувствительное, что guardrail мог бы
залогировать — это, по определению, данные, ради ловли которых правило
существует. OrcaRouter не хранит её, пока вы не согласитесь для каждого
guardrail.
2. Что держит запись совпадения
Совпадение — это маленькая диагностическая запись, ограниченная рабочим пространством. С Log raw content выключенным она несёт только метаданные:| Поле | Пример | Присутствует с переключателем выкл? |
|---|---|---|
| Тип правила | pii, regex, keyword | Да |
| Действие | block, mask, flag | Да |
| Стадия | input, output | Да |
| Деталь | короткая строка-классификатор (например, сущность) | Да |
| Совпавшая подстрока | jane@acme.com | Только когда ВКЛ |
3. Один конкретный пример
Возьмите guardrail с правиломpii, которое маскирует email в запросе,
привязанный к ключу. Вызывающий отправляет:
[EMAIL] до того, как модель его увидит, и
совпадение попадает в ленту. Что это совпадение содержит, зависит
целиком от переключателя:
Log raw content ВЫКЛ (по умолчанию)
Log raw content ВЫКЛ (по умолчанию)
Совпадение записывает: тип правила
pii, действие mask, стадия
input и строку-деталь, называющую сущность email. Оно не
хранит jane@acme.com. Вы знаете, что email был замаскирован в
запросе; вы не можете прочитать email обратно из ленты.Log raw content ВКЛ
Log raw content ВКЛ
То же совпадение дополнительно несёт совпавшую подстроку —
jane@acme.com — так что вы можете точно подтвердить, что правило
поймало, во время прохода сортировки.4. Включение (и гарантия неретроактивности)
Log raw content — настройка для каждого guardrail. Редактирование guardrail — действие консоли под вашей собственной сессией и требует Developer+ в рабочем пространстве — только финальный вызов/v1/*
использует relay-ключ sk-orca-....
Откройте guardrail
В консоли откройте Guardrails и отредактируйте политику, для
которой хотите захватывать подстроки.
Включите Log raw content
Включите переключатель Log raw content и сохраните. Сохранение
пишет версионированную строку истории, так что изменение проверяемо и
откатываемо — см.
Версионирование.
5. Что захватывается, когда он включён
Когда Log raw content включён, движок прикрепляет литеральный совпавший текст к каждому нарушению, с двумя жёсткими лимитами, которые держат один патологический ввод от раздувания одной записи совпадения:- Максимум 32 совпавших записи на нарушение.
- Каждая запись ограничена 256 символами.
Даже с включённым переключателем guardrail когда-либо записывает только
текст, который правило реально совпало. Окружающий промпт и остальной
ответ никогда не копируются в ленту Matches. Полные полезные нагрузки
запроса/ответа — отдельная забота от диагностики guardrail.
6. Удаление подстрок, которые вы уже захватили
Поскольку переключатель не ретроактивен, выключение его оставляет прежние подстроки на месте. Две поверхности их очищают:| Хотите удалить | Как |
|---|---|
| Одно шумное совпадение | Пометьте его ложным срабатыванием — POST /api/guardrail/match/:id/mark-fp (Admin рабочего пространства) или действие Mark false positive в ленте. |
| Все совпадения guardrail для пользователя | Самоудаление пользователя запускает 30-дневное окно отсрочки, затем очистку PII, которая каскадирует через совпадения guardrail, логи запросов и события firewall. См. Compliance. |
7. Кто что может читать
Лента Matches — диагностические данные, ограниченные рабочим пространством. Доступ на чтение открыт каждому активному участнику; деструктивное действие ложного срабатывания шлюзовано выше:| Действие | Маршрут | Роль |
|---|---|---|
| Список / группировка / статистика / экспорт совпадений | GET /api/guardrail/match* | Member |
| Детали одного совпадения | GET /api/guardrail/match/:id | Member |
| Пометить / снять пометку ложного срабатывания | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| Редактировать guardrail (вкл. Log raw content) | PUT /api/guardrail/ | Developer+ |
8. Практичный дефолт приватности
Для большинства рабочих пространств правильная форма такая: оставьте Log raw content выключенным, прогоняйте ваши guardrails на метаданных и включайте переключатель временно для одной политики, когда вы активно отлаживаете, почему правило срабатывает так, как срабатывает. Затем выключите его обратно — новые совпадения немедленно перестают нести подстроки.9. Куда двигаться дальше
Лента Matches
Просматривайте, группируйте, фильтруйте и экспортируйте каждое
записанное совпадение.
Настройка ложных срабатываний
Помечайте и уточняйте совпадения, чтобы утихомирить шумное правило.
Версионирование
Каждое переключение рычага — версионированное, откатываемое изменение.
Compliance
Хранение, удаление данных субъекта и подписанные отчёты.
