跳转到主要内容
你想快速放置一个内容策略,而不必手写正则或 PII 实体列表。 模板库就是那条捷径:一组现成的防护栏预设,按用例分组,每一个 都一键播下一个可工作的策略。选择一个、命名它,你就有了一个可以 绑定到密钥的完整有序规则集——或者先编辑。 这是预设用例的专注落地页。完整的防护栏引擎——每种规则类型、 字段、动作和路由——请见防护栏参考

1. AI 防护栏模板库给你什么

一个预设是一个命名的起点,它把一个完整的 Policy(一条或 多条有序规则)放进创建模态框。预设在服务端编写,因此控制台 选择器、Test 沙箱和这些 文档描述的都是完全相同的行为——只有一个真实来源。 每个预设都是种子,而不是锁。一旦你应用一个,你就拥有这份 副本:重命名它、添加或删除规则、更改一条规则的 动作阶段、重新调优一个检测器。 原始模板的任何东西都不约束你的编辑。
应用一个预设,像所有防护栏编写一样,是你自己工作区会话下的 控制台操作,且创建或编辑一个防护栏需要工作区中的 Developer+。只有最后的 /v1/* 中继调用使用 sk-orca-... 密钥。

2. 预设类别

选择器把预设分组到八个类别。每一个都映射到一个你本来会手工 构建的常见控制:
检测并脱敏(或拦截)email、电话、SSN、卡号、IP 等。从 PII Shield开始进行单规则 脱敏,或当 PII 绝不能到达提供商时用一个严格的拦截器。
在 AWS / OpenAI / GitHub 密钥、PEM 私钥、云令牌和加密钱包地址 离开网关之前拦截它们。参见 拦截密钥
PCI 卡号拦截、欧盟/英国标识符拦截、医疗标识符拦截,以及一个 在不改变流量的情况下记录 PII 出现的仅观察 合规日志记录器
针对脏话、竞争对手提及和区域特定禁用词的关键词拒绝列表—— block 或 mask。参见 品牌安全敏感词
针对提示注入短语、越狱 / 角色扮演模式、系统提示泄露检测和 自残拒绝列表的 keyword/regex 防护栏。参见 提示注入
对请求提示词和模型响应的 max_chars 上限,以约束成本和延迟。 参见成本防护栏
针对智能体流程的 URL 过滤器、markdown 图片拦截(图片外泄 防御)、shell 注入模式,以及输出中 SQL 注入过滤器。参见 智能体防护栏
.env / 密钥文件赋值拦截、对请求和模型输出上的强 copyleft 许可证 flag(GPL / AGPL / LGPL / SSPL),以及一个对引用高风险 sink(evalos.systempickle.loads)的提示词进行 annotate 的非拦截警示。参见 代码安全
预设只播下确定性规则类型——keyword、regex、PII 和 max-chars。 高级规则类型(外部供应商、 LLM judge、上下文 grounding) 从规则构建器添加,而不是从模板,因为它们需要一个你选择的连接 或模型。

3. 把一个预设作为种子应用

这里的每一步都是一个控制台操作。中继密钥只出现在最后的 请求中。
1

打开模板选择器

在控制台中打开 Guardrails,点击 New guardrail 分裂 按钮。选择器打开时按上面的八个类别分组。
2

选择一个预设

选择一个——例如 PII 类别中的 PII Shield。它播下一个 完整的策略(这里是单条脱敏 pii 规则)。选择器显示每个预设的 描述,因此你在应用它之前就知道它做什么。
3

命名它并自由编辑

给它起一个名字(≤ 64 字符)。播下的规则现在是你的了——添加、 删除或重新调优它们中的任何一个。预设是种子,而不是锁。
4

绑定前先测试

打开 Test 标签页,粘贴一个样本,选择一个阶段,并在本地 运行该策略——没有上游调用,没有配额。在任何密钥指向它之前 证明它如你所愿地工作。
5

绑定一个密钥

编辑一个 API 密钥,从 Guardrail 下拉菜单选择该防护栏(在 密钥上设置 guardrail_id),或将它标记为工作区默认值。参见 绑定到密钥账户默认值

4. 一个具体示例:播种,然后执行

应用 PII Shield 预设。它正好播下一条规则:
{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}
这是一个开箱即用的可用脱敏策略。但由于预设是一个种子,你可以 立即收紧它——例如,通过按实体覆盖把两个实体换成 block,使 卡号和 SSN 被直接拒绝,而其余的被脱敏:
{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}
保存、绑定到一个密钥,并像以前一样调用网关——无需修改 SDK, 无需重新部署:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
网关会在转发前把 email 脱敏为 [EMAIL]。一个携带卡号的请求会 以 HTTP 400 guardrail_blocked 被拒绝——这不消耗配额 (输入拦截在计量之前触发)并被标记为 skip-retry。参见 guardrail_blocked 错误
PII Shield 预设播下一条 both 阶段的脱敏规则,但对模型 输出和流式响应的实时脱敏在规划路线图上——输入阶段脱敏是 已上线的路径(网关在模型看到之前擦洗请求)。要在今天把关模型 的响应,一条输出 block 规则在流式和非流式上都会执行。参见 输出阶段规则流式覆盖

5. 应用之后——其余的就是引擎

一个预设只是一种快速编写规则的方式。下游的一切都是普通的 防护栏引擎:
你得到在哪里
按规则的动作动作
测试 + eval测试与 eval
触发了什么Matches 信息流
回滚一次变更版本管理
对一个防护栏的每次创建、更新和删除——包括你应用一个预设并保存 的那一刻——都会写入一条版本化的历史记录。你可以 diff 任意两个 版本并回退到一个更早的版本,因此编辑一个被播种的策略永不是 单向门。参见版本管理

6. 接下来去哪里

PII Shield

一键式的 PII 脱敏预设,从头到尾。

拦截密钥

Secrets Blocker 预设——在请求中捕获密钥和凭证。

智能体防护栏

针对智能体流程的 URL、markdown 图片、shell 和 SQL 过滤器。

防护栏参考

完整引擎——每种规则类型、字段和路由。
预设播下内容策略。要治理智能体的工具调用——拒绝破坏性 动作、脱敏工具调用参数、要求审批——从 防火墙保护 AI 智能体开始。关于 这两个层如何分工,参见 防护栏 vs. 防火墙