セキュアエージェントベースライン

保護を受けるためにひとつのファイアウォールルールを作成する必要はありません。 自律性コントロール — セキュアエージェントベースラインとも呼ばれます — はひとつのトランザクションでワークスペースに完全なゼロトラスト姿勢を適用します：ファイアウォールとガードレール、一緒に、ワンクリック取り消しとともに。これが意味のあるセキュリティ姿勢への最速パスです。後でルールを作成してチューニングします；まずここから始めます。

セキュアエージェントベースラインは自律性コントロールです — 別の「ベースライン」オブジェクトはありません。自律性レベルを適用すると、ファイアウォールポリシーとガードレール（レベルにちなんで命名）がアトミックに書き込まれ、ひとつのトランザクションでワークスペースのライブ姿勢になります。その後、それらを開いて編集できます。ワンクリック取り消しは監査スナップショットから以前の状態を復元します。

1. 自律性コントロールが行うこと

同じ 2 つのレイヤーをカバーする 3 つのレベル：

レベル	ファイアウォール姿勢	ガードレール	Observe mode
`tight`	デフォルト deny；破壊的シェルと SSRF egress を deny	PII Shield + Secrets Blocker を強制	オフ
`balanced`	デフォルト audit；破壊的シェルを deny	PII Shield が audit-only モード（PII をフラグ）	オフ
`permissive`	強制ポリシーなし	ガードレールなし	オン — すべてのツール呼び出しがカバレッジギャップとしてログされます

balanced が推奨される開始姿勢です。 エージェントが行うすべてを audit し、PII をフラグしながら、最も破壊的なアクション（破壊的シェル）を deny します — そのため、他に何を制限するかを決める前にエージェントの実際の動作を確認できます。何もブロックしないパスについては、permissive から始めます。 tight はエージェントの通常の動作を理解したら適切なターゲットです。デフォルト deny 姿勢をすぐに強制します：破壊的シェルを deny、SSRF egress を deny、PII Shield と Secrets Blocker ガードレールの両方がアクティブ（リクエストを PII とシークレットのためにスクリーニング）。 permissive はすべての強制をオフにしますが、observe mode をオンのままにするため、すべてのツール呼び出しが引き続きログされます。偶発的なブロックのリスクなしにまったく新しいエージェントを監査するために使用します — その後、それが何をするかを把握したら balanced または tight に移行します。

2. レベルを適用する方法

変更をプレビューする（オプションだが推奨）

適用する前にレベルをシミュレートします。コンソールの Simulate ビュー（Firewall → Posture の下）または API は、どのルールとガードレールがアクティブになるかを正確に示します — 何も変わりません。

# tight をシミュレート — 完全なポリシー差分を返す、何も適用されない
GET /api/workspace/firewall/simulate?level=tight

ロール：メンバー（読み取り専用、変更なし）。

コンソールでレベルを選ぶ

コンソールの Firewall → Posture に移動します。自律性レベルコントロールから balanced、tight、または permissive を選択して確認します。変更は次のツール呼び出しで有効になります — 再デプロイ不要。ロール：適用には Developer+ が必要。

または API 経由で適用する

POST /api/workspace/firewall/autonomy
Content-Type: application/json

{ "level": "balanced" }

レスポンスには audit_id が含まれます — 保持しておいてください。取り消しに必要です。ロール：Developer+。

イベントとマッチを見る

適用後、Firewall → Events / Runs でツール呼び出しの判定を確認し、 Guardrails → Matches でコンテンツポリシーのヒットを確認します。両方のフィードはリアルタイムで更新されます。予期しないものが発火した場合、さらに強化する前に確認します。

必要に応じて取り消す

すべての自律性変更はひとつの呼び出しで取り消せます。取り消しは以前の正確な状態 — ポリシー、ルール、ガードレール、設定 — を一般的なリセットではなく監査スナップショットから復元します。

POST /api/workspace/firewall/autonomy/undo/:audit_id

ロール：Developer+。audit_id はレベルを適用したときに返されます（ステップ 3）そして Firewall → Audit でも確認できます。

3. 推奨されるパス

balanced から始める → tight をシミュレート → 観察 → 強化。

balanced を適用 — 完全な監査証跡を得ます；破壊的シェルのみが deny され、他はすべて audit されます。1〜2 日間通常通りエージェントを実行します。
tight をシミュレート — GET /api/workspace/firewall/simulate?level=tight を実行し、deny されるものと Events フィードで見たものを比較します。破壊的シェル呼び出しや SSRF スタイルのアウトバウンドリクエストが通常のトラフィックの一部であれば、まずエージェントでそれらを修正します。
Events と Matches を見る — Firewall → Events はすべてのツール呼び出し判定を表示します；Guardrails → Matches はコンテンツポリシーのヒットを表示します。両方とも判定、ツール、実行、セッションでフィルタリング可能です。
tight を適用 — シミュレート出力に驚きがなければ、tight を適用します。本番で何かが壊れた場合、取り消しはひとつの呼び出しで行えます。
ルールでチューニング — ファイアウォールルールを使用して例外を設定したり、プリセットレベルがカバーしないコントロールを追加したりします。自律性レベルはフロア；カスタムルールが精度を追加します。

4. ロール要件

アクション	最低ロール
レベルをシミュレート（`GET .../simulate`）	メンバー
監査証跡を読み取る	メンバー
ガードレールの Matches を見る	メンバー
ファイアウォールの Events & Runs を見る	Developer+
自律性レベルを適用する	Developer+
自律性変更を取り消す	Developer+

5. これが何ではないか

ブラックボックスではありません。 自律性レベルを適用すると、実際のファイアウォールポリシーとガードレール（レベルにちなんで命名）が書き込まれ、ワークスペースのライブ姿勢になります。その後、開いて検査・編集できます — 高速な出発点であり、ロックされたプリセットではありません。
限定的に可逆的。 ワンクリック取り消しは監査スナップショットから以前のファイアウォールとガードレール状態を復元します。監査ログのサイズ制限を超えるスナップショットを持つ非常に大きなワークスペースの場合、適用は成功しますがその変更の取り消しは利用できません — 代わりに望むレベルを再適用します。まれですが、知っておく価値があります。
スコープキーの代替ではありません。 自律性コントロールはワークスペースのデフォルト姿勢を設定します。個々の API キーは引き続き細かい制御のために特定のポリシーにアタッチできます。レイヤーがどのように構成されるかについてはガードレール vs. ファイアウォールを参照してください。

自律性コントロールは最初の 30 分のために設計されています — 素早く保護され、エージェントの実際の動作を理解し、推測ではなく可視性の位置から強化します。

クイックスタート

スコープキーとガードレールを含む 5 分間の完全なゼロトラストセットアップ。

ファイアウォール

ルールレベルの詳細 — 判定、サーフェス、引数述語、HITL 承認。

スコープとキークイックスタート

​1. 自律性コントロールが行うこと

​2. レベルを適用する方法

​3. 推奨されるパス

​4. ロール要件

​5. これが何ではないか