这里的每一步都是托管网关(
api.orcarouter.ai)上的控制台
操作。防护栏配置在你自己的会话下运行;只有最后的 /v1/*
调用使用 sk-orca-... 中继密钥。创建和编辑防护栏需要
工作区中的 Developer+ 角色。1. 如何用五步添加 LLM 防护栏
以下是整个流程的概览——每一步在下面展开。2. 创建防护栏
在控制台中打开 Guardrails,点击 New guardrail。防护栏 是一个工作区级别的、命名的内容策略——网关会用这个有序的 规则列表检查请求输入和模型输出。将它命名为pii-shield 并保存。
3. 添加规则
每条规则决定三件事——查找什么(规则类型)、在哪里 查找(一个阶段),以及如何处理(一个动作)。添加一条规则:- Type: PII detection(
pii) - Stage: Input(请求)
- Action: Mask——脱敏匹配项
- Entities:
email、phone、ssn
[EMAIL],SSN 变成 [SSN]。七种规则类型
(keyword、regex、pii、max_chars、external、llm_judge、
grounding)和五种动作(block、mask、flag、annotate、
spotlight)在参考中介绍。
对于这第一个防护栏,一条脱敏规则就足够了。
脱敏在两个阶段都已上线。输入阶段规则在模型看到请求之前
脱敏请求;输出阶段规则脱敏模型的响应——在非流式响应上
以及在流式响应上逐 chunk——在客户端收到之前。Block 在
两个阶段也都会执行。如果你想把关模型的响应,将规则的阶段
设为
output(或 both);参见
输出阶段规则。4. 在沙箱中测试
在把防护栏绑定到任何密钥之前,先证明它如你所愿地工作。 打开编辑器内的 Test 标签页,粘贴一个样本,选择input
阶段,然后运行:
5. 绑定到密钥
在某个密钥指向它之前,防护栏什么都不做。两种绑定方式:按密钥
编辑一个 API 密钥,从 Guardrail 下拉菜单选择该防护栏。
这会在密钥上设置
guardrail_id。参见
绑定到密钥。工作区默认值
将该防护栏标记为工作区默认值,使任何没有明确绑定的
密钥继承它。参见
账户默认值。
| 顺序 | 适用内容 |
|---|---|
| 1 | 密钥明确的 guardrail_id(如果它存在且已启用)。 |
| 2 | 工作区默认值(如果密钥没有绑定)。 |
| 3 | 无——请求与没有策略的工作区字节相同。 |
6. 发送请求
用一个绑定到pii-shield 的密钥,像以前一样调用 OrcaRouter——无需
修改 SDK,无需新的请求头:
[EMAIL]——上游模型永远
看不到该地址。将规则的动作换成 block,紧接着下一个包含
该实体的请求就会以 HTTP 400 guardrail_blocked 被拒绝。
被拦截的请求不消耗配额(输入拦截在计量之前触发;输出
拦截会退回预先扣除的配额),并被标记为 skip-retry。完整的
响应形态见
guardrail_blocked 错误。
7. 接下来去哪里
查看触发了什么
查看触发了什么
每条触发的规则都会记录一个 match——类型、动作、阶段和
一个详情字符串。只有在开启 Log raw content 时(默认
关闭)才记录匹配的子串。参见
Matches 信息流和
日志与隐私。
脱敏不止于基础项
脱敏不止于基础项
PII 检测覆盖
email、phone、credit_card、ssn、ip、
iban、mac_address、jwt、aws_access_key、api_key_openai、
bitcoin_address(外加区域性实体),你也可以编写
自己的。参见 PII Shield、
自定义 PII 实体和
脱敏格式。回滚一次变更
回滚一次变更
每次编辑都会写入一条版本历史记录。打开 History 进行 diff
和回退。参见版本管理。
