模板库与预设 - OrcaRouter

你想快速放置一个内容策略，而不必手写正则或 PII 实体列表。 模板库就是那条捷径：一组现成的防护栏预设，按用例分组，每一个都一键播下一个可工作的策略。选择一个、命名它，你就有了一个可以绑定到密钥的完整有序规则集——或者先编辑。这是预设用例的专注落地页。完整的防护栏引擎——每种规则类型、字段、动作和路由——请见防护栏参考。

1. AI 防护栏模板库给你什么

一个预设是一个命名的起点，它把一个完整的 Policy（一条或多条有序规则）放进创建模态框。预设在服务端编写，因此控制台选择器、Test 沙箱和这些文档描述的都是完全相同的行为——只有一个真实来源。每个预设都是种子，而不是锁。一旦你应用一个，你就拥有这份副本：重命名它、添加或删除规则、更改一条规则的动作或阶段、重新调优一个检测器。原始模板的任何东西都不约束你的编辑。

应用一个预设，像所有防护栏编写一样，是你自己工作区会话下的 控制台操作，且创建或编辑一个防护栏需要工作区中的 Developer+。只有最后的 /v1/* 中继调用使用 sk-orca-... 密钥。

2. 预设类别

选择器把预设分组到八个类别。每一个都映射到一个你本来会手工构建的常见控制：

PII——脱敏或拦截个人数据

检测并脱敏（或拦截）email、电话、SSN、卡号、IP 等。从 PII Shield开始进行单规则脱敏，或当 PII 绝不能到达提供商时用一个严格的拦截器。

Secrets——让凭证不进入提示词

在 AWS / OpenAI / GitHub 密钥、PEM 私钥、云令牌和加密钱包地址离开网关之前拦截它们。参见拦截密钥。

Compliance——受监管数据防护栏

PCI 卡号拦截、欧盟/英国标识符拦截、医疗标识符拦截，以及一个在不改变流量的情况下记录 PII 出现的仅观察合规日志记录器。

Brand——拒绝列表与品牌安全

针对脏话、竞争对手提及和区域特定禁用词的关键词拒绝列表—— block 或 mask。参见品牌安全和敏感词。

Safety——注入、越狱、自残

针对提示注入短语、越狱 / 角色扮演模式、系统提示泄露检测和自残拒绝列表的 keyword/regex 防护栏。参见提示注入。

Cost——大小和长度上限

对请求提示词和模型响应的 max_chars 上限，以约束成本和延迟。参见成本防护栏。

Agent——智能体内容过滤器

针对智能体流程的 URL 过滤器、markdown 图片拦截（图片外泄防御）、shell 注入模式，以及输出中 SQL 注入过滤器。参见智能体防护栏。

Code security——密钥、许可证、高风险 API

.env / 密钥文件赋值拦截、对请求和模型输出上的强 copyleft 许可证 flag（GPL / AGPL / LGPL / SSPL），以及一个对引用高风险 sink（eval、os.system、pickle.loads）的提示词进行 annotate 的非拦截警示。参见代码安全。

预设只播下确定性规则类型——keyword、regex、PII 和 max-chars。高级规则类型（外部供应商、 LLM judge、上下文 grounding）从规则构建器添加，而不是从模板，因为它们需要一个你选择的连接或模型。

3. 把一个预设作为种子应用

这里的每一步都是一个控制台操作。中继密钥只出现在最后的请求中。

打开模板选择器

在控制台中打开 Guardrails，点击 New guardrail 分裂按钮。选择器打开时按上面的八个类别分组。

选择一个预设

选择一个——例如 PII 类别中的 PII Shield。它播下一个完整的策略（这里是单条脱敏 pii 规则）。选择器显示每个预设的描述，因此你在应用它之前就知道它做什么。

命名它并自由编辑

给它起一个名字（≤ 64 字符）。播下的规则现在是你的了——添加、删除或重新调优它们中的任何一个。预设是种子，而不是锁。

绑定前先测试

打开 Test 标签页，粘贴一个样本，选择一个阶段，并在本地运行该策略——没有上游调用，没有配额。在任何密钥指向它之前证明它如你所愿地工作。

绑定一个密钥

编辑一个 API 密钥，从 Guardrail 下拉菜单选择该防护栏（在密钥上设置 guardrail_id），或将它标记为工作区默认值。参见绑定到密钥和账户默认值。

4. 一个具体示例：播种，然后执行

应用 PII Shield 预设。它正好播下一条规则：

{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}

这是一个开箱即用的可用脱敏策略。但由于预设是一个种子，你可以立即收紧它——例如，通过按实体覆盖把两个实体换成 block，使卡号和 SSN 被直接拒绝，而其余的被脱敏：

{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}

保存、绑定到一个密钥，并像以前一样调用网关——无需修改 SDK，无需重新部署：

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

网关会在转发前把 email 脱敏为 [EMAIL]。一个携带卡号的请求会以 HTTP 400 guardrail_blocked 被拒绝——这不消耗配额 （输入拦截在计量之前触发）并被标记为 skip-retry。参见 guardrail_blocked 错误。

PII Shield 预设播下一条 both 阶段的脱敏规则，但对模型输出和流式响应的实时脱敏在规划路线图上——输入阶段脱敏是已上线的路径（网关在模型看到之前擦洗请求）。要在今天把关模型的响应，一条输出 block 规则在流式和非流式上都会执行。参见输出阶段规则和流式覆盖。

5. 应用之后——其余的就是引擎

一个预设只是一种快速编写规则的方式。下游的一切都是普通的防护栏引擎：

你得到	在哪里
按规则的动作	动作
测试 + eval	测试与 eval
触发了什么	Matches 信息流
回滚一次变更	版本管理

对一个防护栏的每次创建、更新和删除——包括你应用一个预设并保存的那一刻——都会写入一条版本化的历史记录。你可以 diff 任意两个版本并回退到一个更早的版本，因此编辑一个被播种的策略永不是单向门。参见版本管理。

6. 接下来去哪里

PII Shield

一键式的 PII 脱敏预设，从头到尾。

拦截密钥

Secrets Blocker 预设——在请求中捕获密钥和凭证。

智能体防护栏

针对智能体流程的 URL、markdown 图片、shell 和 SQL 过滤器。

防护栏参考

完整引擎——每种规则类型、字段和路由。

预设播下内容策略。要治理智能体的工具调用——拒绝破坏性动作、脱敏工具调用参数、要求审批——从防火墙和保护 AI 智能体开始。关于这两个层如何分工，参见防护栏 vs. 防火墙。

​1. AI 防护栏模板库给你什么

​2. 预设类别

​3. 把一个预设作为种子应用

​4. 一个具体示例：播种，然后执行

​5. 应用之后——其余的就是引擎

​6. 接下来去哪里

PII Shield

拦截密钥

智能体防护栏

防护栏参考

1. AI 防护栏模板库给你什么

2. 预设类别

3. 把一个预设作为种子应用

4. 一个具体示例：播种，然后执行

5. 应用之后——其余的就是引擎

6. 接下来去哪里