安全智能体基线

你不必编写一条防火墙规则就能获得保护。自治控制——也称为安全智能体基线——在一个事务中对你的工作区应用完整的零信任姿态：防火墙和防护栏，在一起，支持一键撤销。这是通往有意义安全姿态的最快路径。之后编写规则来调优；从这里开始。

安全智能体基线就是自治控制——没有单独的”基线”对象。应用一个自治级别会原子性地写入一个防火墙策略和一个防护栏（以级别命名），并使它们成为你工作区的实时姿态，在一个事务中。之后你可以打开并编辑它们。一键撤销从审计快照恢复到先前状态。

1. 自治控制做什么

三个级别，每个覆盖相同的两个层：

级别	防火墙姿态	防护栏	观察模式
`tight`	默认拒绝；破坏性 shell 和 SSRF 出站被拒绝	PII Shield + Secrets Blocker 被执行	关闭
`balanced`	默认审计；破坏性 shell 被拒绝	PII Shield 仅审计模式（flag PII）	关闭
`permissive`	无执行策略	无防护栏	开启——每次工具调用都作为覆盖缺口被记录

balanced 是推荐的起始姿态。 它审计你的智能体做的一切并 flag PII，同时仍然拒绝最具破坏性的动作（破坏性 shell）——因此你在决定还要限制什么之前就能看到智能体的真实行为。对于不拦截任何东西 的通过，从 permissive 开始。 tight 是一旦你了解了智能体正常行为后的正确目标。它开箱就执行默认拒绝姿态：破坏性 shell 被拒绝，SSRF 出站被拒绝， PII Shield 和 Secrets Blocker 防护栏都处于活跃状态（筛查你的请求中的 PII 和密钥）。 permissive 关闭所有执行但保持观察模式开启，因此每次工具调用仍然被记录。使用它在没有意外拦截风险的情况下审计一个全新的智能体——然后一旦你知道它做什么就转向 balanced 或 tight。

2. 如何应用一个级别

预览变更（可选但推荐）

在应用之前模拟该级别。控制台 Simulate 视图（在 Firewall → Posture 下）或 API 精确显示哪些规则和防护栏会处于活跃状态——什么都不会改变。

# 模拟 tight——返回完整策略差异，什么都不应用
GET /api/workspace/firewall/simulate?level=tight

角色：Member（只读，无变更）。

在控制台中选择一个级别

在控制台中前往 Firewall → Posture。从自治级别控件选择 balanced、tight 或 permissive 并确认。变更在下一次工具调用时生效——无需重新部署。角色：需要 Developer+ 才能应用。

或通过 API 应用

POST /api/workspace/firewall/autonomy
Content-Type: application/json

{ "level": "balanced" }

响应包含一个 audit_id——保存好它。你撤销时需要它。角色：Developer+。

观察事件和匹配

应用后，前往 Firewall → Events / Runs 查看工具调用判定，以及 Guardrails → Matches 查看内容策略命中。两个信息流都实时更新。如果有你没有预期的东西触发了，在进一步收紧之前先检查它。

如需撤销

任何自治变更都可以通过一次调用撤销。撤销恢复确切的先前状态——策略、规则、防护栏、设置——来自审计快照，而不是通用重置。

POST /api/workspace/firewall/autonomy/undo/:audit_id

角色：Developer+。audit_id 在你应用级别时返回（步骤 3），也在 Firewall → Audit 中可见。

3. 推荐路径

从 balanced 开始 → 模拟 tight → 观察 → 收紧。

应用 balanced——你得到完整的审计追踪；只有破坏性 shell 被拒绝，其他一切被审计。正常运行你的智能体一两天。
模拟 tight——运行 GET /api/workspace/firewall/simulate?level=tight 并将会被拒绝的内容与你在 Events 信息流中看到的内容进行比较。如果破坏性 shell 调用或 SSRF 风格的出站请求是你正常流量的一部分，先在智能体中修复它们。
观察 Events 和 Matches——Firewall → Events 显示每次工具调用判定；Guardrails → Matches 显示内容策略命中。两者都可以按判定、工具、运行和会话过滤。
应用 tight——一旦模拟输出没有意外，应用 tight。如果生产中有东西出问题，撤销只需一次调用。
用规则调优——使用防火墙规则来划出例外或添加预设级别不覆盖的控制。自治级别是你的基准；自定义规则增加精确度。

4. 角色要求

动作	最低角色
模拟一个级别（`GET .../simulate`）	Member
读取审计追踪	Member
查看防护栏 Matches	Member
查看防火墙 Events & Runs	Developer+
应用自治级别	Developer+
撤销自治变更	Developer+

5. 这不是什么

不是黑盒。 应用自治级别会写入一个真实的防火墙策略和防护栏（以级别命名），并使它们成为你工作区的实时姿态。之后你可以打开、检查和编辑它们——这是一个快速起点，而不是锁定的预设。
可逆，有限制。 一键撤销从审计快照恢复先前的防火墙和防护栏状态。对于快照超出审计日志大小限制的非常大的工作区，应用仍然成功但对该变更撤销不可用——你重新应用你想要的级别即可。罕见，但值得了解。
不能替代限定范围的密钥。 自治控制设置工作区的默认姿态。单个 API 密钥仍然可以附加到特定策略以进行更精细的控制。参见防护栏 vs. 防火墙了解层如何组合。

自治控制是为前 30 分钟设计的——快速获得保护，了解智能体的真实行为，然后从可见性的位置而不是猜测来收紧。

快速开始

在 5 分钟内完整零信任设置，包括限定范围的密钥和防护栏。

防火墙

规则级别详情——判定、执行面、参数谓词和 HITL 审批。

​1. 自治控制做什么

​2. 如何应用一个级别

​3. 推荐路径

​4. 角色要求

​5. 这不是什么

快速开始

防火墙

1. 自治控制做什么

2. 如何应用一个级别

3. 推荐路径

4. 角色要求

5. 这不是什么