ファイアウォール API リファレンス

エージェントファイアウォールは 2 つの方法で設定されます：コンソール経由（あなたのセッション、ダッシュボードで使うのと同じログイン）とゲートウェイ経由（エージェントが実行時に提示する専用のファイアウォールスコープ API キー）です。 2 つのファミリーは異なるパスプレフィックスに存在し、異なる認証を取り、異なる質問 — 「ポリシーを編集する」対「このツール呼び出しを評価する」 — に答えます。このページは両方のルート単位のマップです。ポリシーが何を意味するか — 判定、サーフェス、ルール、解決 — については、ファイアウォールとファイアウォールルールから始めてください。このページは API サーフェスのみです。

1. 2 つのルートファミリー

コンソール — 設定する

/api/workspace/firewall/*。あなたのセッション / アクセストークン （UserAuth）で認証され、アクティブなワークスペースにスコープされます。ポリシーを作成し、イベントを読み、MCP サーバーを登録し、承認を解決します。すべてのアクションがロールゲートされています。

ゲートウェイ — 強制する

/api/v1/firewall/*。ファイアウォールゲートウェイスコープのキー （is_firewall_gateway が設定されたキー）で認証されます。エージェントや MCP クライアントが実行時に呼び出すマシン間サーフェスです。通常のリレーキーはここで 403 を受け取ります。

コンソールルートは sk-orca-… リレーキーを決して取らず、ゲートウェイルートはセッショントークンを決して取りません。これらを混同するのが、ファイアウォールを初めて配線するときの最も一般的な 401/403 です。/v1/firewall/* 呼び出しに属する唯一の sk-orca-… キーは、is_firewall_gateway をオンにして発行されたものです — スコープ、キー、ポリシーを参照してください。

2. ロール一覧

コンソールルートはあなたのワークスペースロールを解決し、それに応じてゲートします。ツール呼び出しの来歴を運ばない読み取りは任意のメンバーに開放されています；書き込みと、ツール呼び出し引数を公開するものは Developer+ を必要とします。

ロール	できること
Viewer / member	設定、ポリシー、プリセット、Discovered tools、simulate、anomalies の読み取り。
Developer+	上記すべてに加えて、すべての書き込み、`events`/`runs`/`trace` サーフェス、そして `test` ドライラン。
Admin+	加えて、キーに `is_firewall_gateway` フラグを設定し、ゲートウェイキーの平文を読む。

この分割は意図的です：viewer はポリシーが存在することとそれが何をブロックするかを見ることはできますが、イベントの背後にある生のツール呼び出し引数は見られません。非開発者向けのダッシュボードを構築している場合、読み取り開放ルートが安全なセットです。

3. コンソールからポリシーを設定する

コンソールルートは、ポリシーを作成し検査する方法です。すべてをダッシュボード UI で設定します — これらはそれが呼び出すのと同じエンドポイントです。

ポリシーと設定

メソッドとパス	ロール	目的
`GET /api/workspace/firewall/settings`	Member	観察モード + カウント。
`PUT /api/workspace/firewall/settings`	Developer+	ワークスペースのファイアウォール設定を更新。
`GET /api/workspace/firewall/policies`	Member	ポリシー一覧。
`GET /api/workspace/firewall/policies/:id`	Member	単一ポリシー詳細。
`POST /api/workspace/firewall/policies`	Developer+	ポリシーを作成。
`PUT /api/workspace/firewall/policies`	Developer+	ポリシーを更新。
`DELETE /api/workspace/firewall/policies/:id`	Developer+	ポリシーを削除。
`POST /api/workspace/firewall/rules`	Developer+	ルールを追加。
`PUT /api/workspace/firewall/rules`	Developer+	ルールを更新。
`DELETE /api/workspace/firewall/rules/:id`	Developer+	ルールを削除。

姿勢、プリセット、サンドボックス

メソッドとパス	ロール	目的
`GET /api/workspace/firewall/presets`	Member	組み込みルールプリセット。
`GET /api/workspace/firewall/templates`	Member	ユースケーステンプレートギャラリー。
`POST /api/workspace/firewall/templates/apply`	Developer+	テンプレートを適用 → 1 ポリシー + そのルール。
`POST /api/workspace/firewall/autonomy`	Developer+	自律性レベルを適用（`tight` / `balanced` / `permissive`）。
`POST /api/workspace/firewall/autonomy/undo/:audit_id`	Developer+	監査スナップショットからのワンクリック取り消し。
`GET /api/workspace/firewall/simulate`	Member	レベルが何をブロックするか（`?level=`）。
`POST /api/workspace/firewall/test`	Developer+	サンプル呼び出しに対してポリシーをドライラン。

可観測性

メソッドとパス	ロール	目的
`GET /api/workspace/firewall/discovered-tools`	Member	見たツール、covered / gap とフラグ。
`GET /api/workspace/firewall/events`	Developer+	ファイアウォールイベント一覧（フィルタ可能）。
`GET /api/workspace/firewall/events/by-request/:request_id`	Developer+	1 つのリクエストのイベント。
`GET /api/workspace/firewall/events/aggregate`	Developer+	Runs / sessions ロールアップ。
`GET /api/workspace/firewall/trace/by-run`	Developer+	実行のトレースノード（`?run_id=`）。
`GET /api/workspace/firewall/anomalies`	Member	異常フィード。
`POST /api/workspace/firewall/anomalies/snooze`	Developer+	フィードをスヌーズ（≤ 7 日）。

MCP サーバー

エージェントが到達する Model Context Protocol サーバーを、単一の監査済みゲートウェイの背後で登録します。クレデンシャルは暗号化して保存され、読み取り時にはマスクされます。

メソッドとパス	ロール	目的
`GET /api/workspace/firewall/mcp_servers`	Member	登録済みサーバー一覧。
`GET /api/workspace/firewall/mcp_servers/:id`	Member	サーバー詳細。
`POST /api/workspace/firewall/mcp_servers`	Developer+	サーバーを登録（`name` 重複で `409`）。
`PUT /api/workspace/firewall/mcp_servers`	Developer+	サーバーを更新。
`DELETE /api/workspace/firewall/mcp_servers/:id`	Developer+	サーバーを削除。
`POST /api/workspace/firewall/mcp_servers/:id/probe`	Developer+	到達可能性 + `tools/list` ハンドシェイク。

サーバーは一意の name、endpoint、auth_mode （none / bearer / oauth / basic）、そしてヘルス status （ok / degraded / down）を持ちます。フルライフサイクルとスキル隔離についてはファイアウォール MCPを参照してください。

4. ゲートウェイで強制する

これらは、あなたのセッションではなく、ファイアウォールゲートウェイスコープのキー上で動作します。エージェントループまたは MCP クライアントが実行時に呼び出すものです。

メソッドとパス	目的
`POST /api/v1/firewall/evaluate`	1 つのツール呼び出しに対するディスパッチ前の判定。
`POST /api/v1/firewall/evaluate_plan`	マルチステッププランの実行前チェック。
`ANY /api/v1/firewall/mcp`	統合された MCP ゲートウェイエンドポイント。
`GET /api/v1/firewall/mcp_servers`	ワークスペースの登録済みサーバーを列挙。
`GET /api/v1/firewall/approvals/:id`	保留された呼び出しの承認状態をポーリング。
`POST /api/v1/firewall/approvals/:id/callback`	HMAC 署名付き承認コールバック。

ひとつの具体例：ツール呼び出しを評価する

エージェントがツールをディスパッチする前に、ゲートウェイに判定を尋ねます。リレー sk-orca-… キーではなく、ファイアウォールゲートウェイスコープのキーを渡します：

curl https://api.orcarouter.ai/api/v1/firewall/evaluate \
  -H "Authorization: Bearer <firewall-gateway-key>" \
  -H "Content-Type: application/json" \
  -d '{
    "tool_name": "shell.exec",
    "arguments": { "command": "rm -rf /" }
  }'

レスポンスは判定を運びます — allow、audit、deny、sanitize、または pending_approval。deny では呼び出しをスキップし、理由をモデルに表面化します； sanitize ではゲートウェイが返すクリーニングされた引数を転送します（sanitize はツール呼び出しの引数のみをリダクトします — ツールが返すコンテンツは決して触りません）； pending_approval では下記の承認ループに入ります。

ゲートウェイは、それを横切る呼び出しを評価します — evaluate フック、MCP ゲートウェイ、そしてリレーパスです。エージェントが完全にプロセス内で実行し、OrcaRouter に一度も触れないツールは、その視界の外です。重要な呼び出し（モデル媒介のツール、MCP ディスパッチ、ネットワーク egress）をゲートウェイ経由でルーティングすれば、統制されます。

5. 承認ハンドシェイク（HITL）

pending_approval 判定は、呼び出しを人間のために保留します。保留中の HTTP エラーは firewall_approval_pending です。それをクリアするのは、両方のルートファミリーにまたがる 3 ステップのループです：

レビュアーが保留を解決する

コンソールから（PATCH /api/workspace/firewall/approvals/:id、Developer+）、あるいはあなた自身のシステムが HMAC 署名付きコールバックを POST /api/v1/firewall/approvals/:id/callback にポストします。コールバックは HMAC をインラインで検証します — 他の認証は受け付けられません。

エージェントが承認をポーリングする

ゲートウェイキーを使って GET /api/v1/firewall/approvals/:id を、状態が approved または rejected に変わるまでポーリングします。

単回使用トークンとともに再送信する

承認されると、承認 id を持つ X-OrcaRouter-Firewall-Approval ヘッダーを携えて元の呼び出しを再発行します。ゲートウェイはそれを認識し、その 1 つの呼び出しを通します。ヘッダーは単回使用です。

決定はファーストライタウィンかつ冪等です — 同じ保留の 2 回目の解決は no-op です。エンドツーエンドのフローについてはファイアウォール — 人間による承認を、判定の読み方についてはなぜブロックされたのか？を参照してください。

6. ブロックがどう見えるか

結果	HTTP	コード
拒否されたツール呼び出し（inbound サーフェス）	`400`	`firewall_blocked`
MCP ゲートウェイ経由で拒否	tool error	`firewall deny: <reason>`
承認のために保留	`400`	`firewall_approval_pending`

firewall_blocked は skip-retry とマークされています — 同一の呼び出しを再実行しても再びブロックされるだけなので、リトライするクライアントはハンマリングする代わりにバックオフします。完全なコードリストはエラーコードにあります。

7. 関連リファレンス

ガードレール API

コンテンツポリシーのピア — テキストプレーンのための /api/guardrail/* ルート。

判定用語集

すべての判定と、それが呼び出しに何をするか。

Glob と JSONPath

tool_name_glob と args_match の背後にあるマッチング文法。

コンプライアンス API

パック、署名付きレポート、レジデンシー、そして消去。

8. FAQ

なぜ私のリレーキーは /api/v1/firewall/evaluate で 403 を受け取るのか？

ゲートウェイルートはファイアウォールゲートウェイスコープのキー — is_firewall_gateway を設定して発行されたもの（Admin+ のアクション） — を必要とします。通常のリレーキーは、有効なものでも 403 を受け取ります。エージェントランタイム用に専用のゲートウェイキーを発行してください。

viewer はファイアウォールイベントを読めるか？

いいえ。events、events/aggregate、trace ルートは、レコードがツール呼び出し引数の来歴を運ぶため Developer+ です。Viewer は設定、ポリシー、プリセット、 Discovered tools、simulate、異常フィードを読めます。

保留された承認はどこで解決する — コンソールかゲートウェイか？

どちらでも。人間がコンソールで PATCH /api/workspace/firewall/approvals/:id（Developer+）経由で解決するか、あなた自身のシステムが HMAC 署名付き決定を POST /api/v1/firewall/approvals/:id/callback にポストします。どのパスが解決したかに関わらず、エージェントは GET /api/v1/firewall/approvals/:id をポーリングします。

sanitize はツールが返すものをクリーニングするか？

いいえ。sanitize 判定は、ツール呼び出しの引数のみをリダクトします — ツールが返すコンテンツは決して触りません。inbound サーフェスでは、まだ呼び出し時の引数がないため、sanitize はブロックにエスカレートします。ファイアウォールルールを参照してください。

これらのコントロールがガードレールおよびゲートウェイの他の部分とどう構成されるかについては、AI エージェントのセキュリティとガードレール vs ファイアウォールを参照してください。

​1. 2 つのルートファミリー

コンソール — 設定する

ゲートウェイ — 強制する

​2. ロール一覧

​3. コンソールからポリシーを設定する

​ポリシーと設定

​姿勢、プリセット、サンドボックス

​可観測性

​MCP サーバー

​4. ゲートウェイで強制する

​ひとつの具体例：ツール呼び出しを評価する

​5. 承認ハンドシェイク（HITL）

​6. ブロックがどう見えるか

​7. 関連リファレンス

ガードレール API

判定用語集

Glob と JSONPath

コンプライアンス API

​8. FAQ

1. 2 つのルートファミリー

2. ロール一覧

3. コンソールからポリシーを設定する

ポリシーと設定

姿勢、プリセット、サンドボックス

可観測性

MCP サーバー

4. ゲートウェイで強制する

ひとつの具体例：ツール呼び出しを評価する

5. 承認ハンドシェイク（HITL）

6. ブロックがどう見えるか

7. 関連リファレンス

8. FAQ