セキュアエージェント ベースラインは自律性コントロールです — 別の「ベースライン」
オブジェクトはありません。自律性レベルを適用すると、ファイアウォールポリシーと
ガードレール(レベルにちなんで命名)がアトミックに書き込まれ、ひとつのトランザクションで
ワークスペースのライブ姿勢になります。その後、それらを開いて編集できます。
ワンクリック取り消しは監査スナップショットから以前の状態を復元します。
1. 自律性コントロールが行うこと
同じ 2 つのレイヤーをカバーする 3 つのレベル:| レベル | ファイアウォール姿勢 | ガードレール | Observe mode |
|---|---|---|---|
tight | デフォルト deny;破壊的シェルと SSRF egress を deny | PII Shield + Secrets Blocker を強制 | オフ |
balanced | デフォルト audit;破壊的シェルを deny | PII Shield が audit-only モード(PII をフラグ) | オフ |
permissive | 強制ポリシーなし | ガードレールなし | オン — すべてのツール呼び出しがカバレッジギャップとしてログされます |
balanced が推奨される開始姿勢です。 エージェントが行うすべてを audit し、PII を
フラグしながら、最も破壊的なアクション(破壊的シェル)を deny します — そのため、
他に何を制限するかを決める前にエージェントの実際の動作を確認できます。何もブロック
しないパスについては、permissive から始めます。
tight はエージェントの通常の動作を理解したら適切なターゲットです。デフォルト deny
姿勢をすぐに強制します:破壊的シェルを deny、SSRF egress を deny、PII Shield と
Secrets Blocker ガードレールの両方がアクティブ(リクエストを PII とシークレット
のためにスクリーニング)。
permissive はすべての強制をオフにしますが、observe mode をオンのままにするため、
すべてのツール呼び出しが引き続きログされます。偶発的なブロックのリスクなしにまったく
新しいエージェントを監査するために使用します — その後、それが何をするかを把握したら
balanced または tight に移行します。
2. レベルを適用する方法
変更をプレビューする(オプションだが推奨)
適用する前にレベルをシミュレートします。コンソールの Simulate ビュー
(Firewall → Posture の下)または API は、どのルールとガードレールがアクティブに
なるかを正確に示します — 何も変わりません。ロール:メンバー(読み取り専用、変更なし)。
コンソールでレベルを選ぶ
コンソールの Firewall → Posture に移動します。自律性レベルコントロールから
balanced、tight、または permissive を選択して確認します。変更は次のツール
呼び出しで有効になります — 再デプロイ不要。ロール:適用には Developer+ が必要。イベントとマッチを見る
適用後、Firewall → Events / Runs でツール呼び出しの判定を確認し、
Guardrails → Matches でコンテンツポリシーのヒットを確認します。
両方のフィードはリアルタイムで更新されます。予期しないものが発火した場合、
さらに強化する前に確認します。
3. 推奨されるパス
balanced から始める → tight をシミュレート → 観察 → 強化。
balancedを適用 — 完全な監査証跡を得ます;破壊的シェルのみが deny され、 他はすべて audit されます。1〜2 日間通常通りエージェントを実行します。tightをシミュレート —GET /api/workspace/firewall/simulate?level=tightを実行し、deny されるものと Events フィードで見たものを比較します。 破壊的シェル呼び出しや SSRF スタイルのアウトバウンドリクエストが通常の トラフィックの一部であれば、まずエージェントでそれらを修正します。- Events と Matches を見る — Firewall → Events はすべてのツール呼び出し判定を 表示します;Guardrails → Matches はコンテンツポリシーのヒットを表示します。 両方とも判定、ツール、実行、セッションでフィルタリング可能です。
tightを適用 — シミュレート出力に驚きがなければ、tightを適用します。 本番で何かが壊れた場合、取り消しはひとつの呼び出しで行えます。- ルールでチューニング — ファイアウォールルールを使用して 例外を設定したり、プリセットレベルがカバーしないコントロールを追加したりします。 自律性レベルはフロア;カスタムルールが精度を追加します。
4. ロール要件
| アクション | 最低ロール |
|---|---|
レベルをシミュレート(GET .../simulate) | メンバー |
| 監査証跡を読み取る | メンバー |
| ガードレールの Matches を見る | メンバー |
| ファイアウォールの Events & Runs を見る | Developer+ |
| 自律性レベルを適用する | Developer+ |
| 自律性変更を取り消す | Developer+ |
5. これが何ではないか
- ブラックボックスではありません。 自律性レベルを適用すると、実際のファイアウォール ポリシーとガードレール(レベルにちなんで命名)が書き込まれ、ワークスペースの ライブ姿勢になります。その後、開いて検査・編集できます — 高速な出発点であり、 ロックされたプリセットではありません。
- 限定的に可逆的。 ワンクリック取り消しは監査スナップショットから以前の ファイアウォールとガードレール状態を復元します。監査ログのサイズ制限を超える スナップショットを持つ非常に大きなワークスペースの場合、適用は成功しますが その変更の取り消しは利用できません — 代わりに望むレベルを再適用します。 まれですが、知っておく価値があります。
- スコープキーの代替ではありません。 自律性コントロールはワークスペースの デフォルト姿勢を設定します。個々の API キーは引き続き細かい制御のために 特定のポリシーにアタッチできます。レイヤーがどのように構成されるかについては ガードレール vs. ファイアウォール を参照してください。
自律性コントロールは最初の 30 分のために設計されています — 素早く保護され、 エージェントの実際の動作を理解し、推測ではなく可視性の位置から強化します。
クイックスタート
スコープキーとガードレールを含む 5 分間の完全なゼロトラストセットアップ。
ファイアウォール
ルールレベルの詳細 — 判定、サーフェス、引数述語、HITL 承認。
