安全智能体基线就是自治控制——没有单独的”基线”对象。应用一个
自治级别会原子性地写入一个防火墙策略和一个防护栏(以级别命名),
并使它们成为你工作区的实时姿态,在一个事务中。之后你可以打开并
编辑它们。一键撤销从审计快照恢复到先前状态。
1. 自治控制做什么
三个级别,每个覆盖相同的两个层:| 级别 | 防火墙姿态 | 防护栏 | 观察模式 |
|---|---|---|---|
tight | 默认拒绝;破坏性 shell 和 SSRF 出站被拒绝 | PII Shield + Secrets Blocker 被执行 | 关闭 |
balanced | 默认审计;破坏性 shell 被拒绝 | PII Shield 仅审计模式(flag PII) | 关闭 |
permissive | 无执行策略 | 无防护栏 | 开启——每次工具调用都作为覆盖缺口被记录 |
balanced 是推荐的起始姿态。 它审计你的智能体做的一切并
flag PII,同时仍然拒绝最具破坏性的动作(破坏性 shell)——因此
你在决定还要限制什么之前就能看到智能体的真实行为。对于不拦截任何东西
的通过,从 permissive 开始。
tight 是一旦你了解了智能体正常行为后的正确目标。它开箱
就执行默认拒绝姿态:破坏性 shell 被拒绝,SSRF 出站被拒绝,
PII Shield 和 Secrets Blocker 防护栏都处于活跃状态(筛查你的
请求中的 PII 和密钥)。
permissive 关闭所有执行但保持观察模式开启,因此每次工具
调用仍然被记录。使用它在没有意外拦截风险的情况下审计一个全新
的智能体——然后一旦你知道它做什么就转向 balanced 或 tight。
2. 如何应用一个级别
预览变更(可选但推荐)
在应用之前模拟该级别。控制台 Simulate 视图(在
Firewall → Posture 下)或 API 精确显示哪些规则和防护栏会
处于活跃状态——什么都不会改变。角色:Member(只读,无变更)。
在控制台中选择一个级别
在控制台中前往 Firewall → Posture。从自治级别控件选择
balanced、tight 或 permissive 并确认。变更在下一次
工具调用时生效——无需重新部署。角色:需要 Developer+ 才能应用。观察事件和匹配
应用后,前往 Firewall → Events / Runs 查看工具调用
判定,以及 Guardrails → Matches 查看内容策略命中。
两个信息流都实时更新。如果有你没有预期的东西触发了,
在进一步收紧之前先检查它。
3. 推荐路径
从balanced 开始 → 模拟 tight → 观察 → 收紧。
- 应用
balanced——你得到完整的审计追踪;只有破坏性 shell 被拒绝,其他一切被审计。正常运行你的智能体一两天。 - 模拟
tight——运行GET /api/workspace/firewall/simulate?level=tight并将会被拒绝的内容与你在 Events 信息流中看到的内容进行比较。 如果破坏性 shell 调用或 SSRF 风格的出站请求是你正常流量的一部分, 先在智能体中修复它们。 - 观察 Events 和 Matches——Firewall → Events 显示每次工具调用 判定;Guardrails → Matches 显示内容策略命中。两者都可以按 判定、工具、运行和会话过滤。
- 应用
tight——一旦模拟输出没有意外,应用tight。如果 生产中有东西出问题,撤销只需一次调用。 - 用规则调优——使用防火墙规则来划出 例外或添加预设级别不覆盖的控制。自治级别是你的基准;自定义规则 增加精确度。
4. 角色要求
| 动作 | 最低角色 |
|---|---|
模拟一个级别(GET .../simulate) | Member |
| 读取审计追踪 | Member |
| 查看防护栏 Matches | Member |
| 查看防火墙 Events & Runs | Developer+ |
| 应用自治级别 | Developer+ |
| 撤销自治变更 | Developer+ |
5. 这不是什么
- 不是黑盒。 应用自治级别会写入一个真实的防火墙策略和防护栏 (以级别命名),并使它们成为你工作区的实时姿态。之后你可以打开、 检查和编辑它们——这是一个快速起点,而不是锁定的预设。
- 可逆,有限制。 一键撤销从审计快照恢复先前的防火墙和防护栏 状态。对于快照超出审计日志大小限制的非常大的工作区,应用仍然 成功但对该变更撤销不可用——你重新应用你想要的级别即可。罕见, 但值得了解。
- 不能替代限定范围的密钥。 自治控制设置工作区的默认姿态。 单个 API 密钥仍然可以附加到特定策略以进行更精细的控制。参见 防护栏 vs. 防火墙 了解层如何组合。
自治控制是为前 30 分钟设计的——快速获得保护,了解智能体的真实 行为,然后从可见性的位置而不是猜测来收紧。
快速开始
在 5 分钟内完整零信任设置,包括限定范围的密钥和防护栏。
防火墙
规则级别详情——判定、执行面、参数谓词和 HITL 审批。
