1. 防护栏隐私日志:默认关闭
每个防护栏都带有一个按策略的单一开关 Log raw content,它发布时 关闭。当它关闭时,匹配记录触发内容的元数据,但永不把违规文本 复制进信息流:开关关闭时记录
规则类型、动作、阶段和一个简短的详情字符串——足以知道一条
pii 规则在请求上脱敏了一个 email,而不存储该地址。仅开启时增加
匹配的子串——规则捕获的字面文本。只为你启用开关之后
记录的匹配捕获。
默认关闭是隐私保守的姿态。 匹配的子串是防护栏可能记录的最
敏感的东西——按定义它就是规则存在所要捕获的数据。除非你按防护栏
选择开启,否则 OrcaRouter 不存储它。
2. 一条匹配记录持有什么
匹配是一条小型的、工作区级别的诊断记录。当 Log raw content 关闭时,它只携带元数据:| 字段 | 示例 | 开关关闭时是否存在? |
|---|---|---|
| 规则类型 | pii、regex、keyword | 是 |
| 动作 | block、mask、flag | 是 |
| 阶段 | input、output | 是 |
| 详情 | 简短分类字符串(例如实体) | 是 |
| 匹配的子串 | jane@acme.com | 仅开启时 |
3. 一个具体示例
拿一个带有在请求上脱敏email 的 pii 规则、绑定到一个密钥的
防护栏。一个调用方发送:
[EMAIL],一条匹配落入信息流。
那条匹配包含什么完全取决于该开关:
Log raw content 关闭(默认)
Log raw content 关闭(默认)
匹配记录:规则类型
pii、动作 mask、阶段 input,以及一个
指明 email 实体的详情字符串。它不存储 jane@acme.com。
你知道一个 email 在请求上被脱敏了;你无法从信息流中读回该
email。Log raw content 开启
Log raw content 开启
同一条匹配额外携带匹配的子串——
jane@acme.com——因此你可以在
一次分诊中精确确认规则捕获了什么。4. 开启它(以及不可追溯保证)
Log raw content 是一个按防护栏的设置。编辑一个防护栏是你 自己会话下的控制台操作,且需要工作区中的 Developer+——只有 最后的/v1/* 调用使用 sk-orca-... 中继密钥。
启用 Log raw content
开启 Log raw content 开关并保存。保存会写入一条版本化的
历史记录,因此该变更可审计且可回退——参见
版本管理。
5. 开启时捕获什么
当 Log raw content 开启时,引擎把字面匹配文本附加到每个违规上, 带有两个硬性上限,防止一个病态输入让单条匹配记录膨胀:- 每个违规至多 32 个匹配条目。
- 每个条目上限为 256 个字符。
即使开关开启,防护栏也只记录一条规则实际匹配的文本。周围的
提示词和响应的其余部分永不被复制进 Matches 信息流。完整的
请求/响应负载与防护栏诊断是不同的关切。
6. 移除你已经捕获的子串
由于开关不可追溯,关闭它会让先前的子串保持原位。两个面可以清除 它们:| 想移除 | 如何 |
|---|---|
| 一条嘈杂的匹配 | 把它标记为误报——POST /api/guardrail/match/:id/mark-fp(工作区 Admin),或信息流中的 Mark false positive 操作。 |
| 一个用户的所有防护栏匹配 | 用户自助删除会触发一个 30 天宽限窗口,然后一次 PII 擦洗会级联穿过防护栏匹配、请求日志和防火墙事件。参见合规。 |
7. 谁能读什么
Matches 信息流是工作区级别的诊断数据。读取访问对每个活跃 成员开放;破坏性的误报操作门控更高:| 操作 | 路由 | 角色 |
|---|---|---|
| 列出 / 分组 / 统计 / 导出匹配 | GET /api/guardrail/match* | Member |
| 单条匹配详情 | GET /api/guardrail/match/:id | Member |
| 标记 / 取消标记误报 | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| 编辑一个防护栏(含 Log raw content) | PUT /api/guardrail/ | Developer+ |
8. 一个务实的隐私默认值
对大多数工作区,正确的形态是:让 Log raw content 保持关闭, 在元数据上运行你的防护栏,并在你正在主动调试一条规则为什么那样 触发时,临时为单个策略开启该开关。然后把它翻回关闭——新匹配 立即停止携带子串。9. 接下来去哪里
Matches 信息流
浏览、分组、过滤并导出每条记录的匹配。
调优误报
标记和精炼匹配以安抚一条嘈杂规则。
版本管理
每次开关翻转都是一次版本化的、可回退的变更。
合规
保留、数据主体擦除,以及签名报告。
