1. なぜゲートウェイが適切な検査ポイントであるか
ほとんどのセキュリティコントロールはアプリケーションに存在します:ライブラリ ラッパー、エージェントフレームワークフック、プロバイダごとの SDK。それらのコントロールには 致命的な構造的欠陥があります — 2 番目のプロバイダを追加したり、フレームワークを 変更したり、エージェントが新しいスキルを自己インストールしたりするとすぐに壊れます。 ゲートウェイにはそのような継ぎ目はありません。エージェントが発行するすべての呼び出しは、 モデル、プロバイダ、またはツールケイパビリティがどのように到達したかに関わらず、 アップストリームに到達する前に単一のポイントを通過します。これが保証を行える唯一の レイヤーです:もし起きたなら、ゲートウェイはそれを見た。 OrcaRouter はその位置を 2 つの異なる強制パスに使用します:- ガードレールはテキストをスクリーニングします — エージェントが送るプロンプトと
モデルが返すレスポンス。ガードレールのブロックは HTTP 400
guardrail_blockedを返し、クォータを消費しません。 - ファイアウォールはアクションを判断します — エージェントが呼び出すツール、
到達する MCP サーバー、および報告するネットワーク宛先。ファイアウォールの deny は
inbound サーフェスでは HTTP 400
firewall_blockedを返し、MCP サーフェスでは ツールエラーを返すため、モデルは拒否を見て推論できます。
https://api.orcarouter.ai/v1 を
以前と全く同様に呼び出し続けます。
2. 4 つの強制サーフェス
ファイアウォールはすべてのツール呼び出しを正確にひとつのサーフェス — ゲートウェイが呼び出しライフサイクル上でそれを見るポイント — に対して評価します。| サーフェス | ゲートウェイが見るもの |
|---|---|
inbound | エージェントがリクエストでモデルにアドバタイズするツール — ツール定義。ここでブロックすることでモデルが危険なツールを選択することを防ぎます。 |
response | モデルがその返信で発行する tool_calls — ディスパッチされる前のモデルが選択したアクション。 |
mcp | ファイアウォール MCP ゲートウェイ経由でディスパッチされるか、SDK フック経由で評価される tools/call — ディスパッチの瞬間の呼び出し。 |
egress | ツールが報告するアウトバウンドネットワーク宛先(ホスト / IP / CIDR) — SSRF とデータ持ち出しのサーフェス。 |
input(リクエストプロンプトとメッセージ)と output(モデルのレスポンステキスト)。
ひとつのリクエストがすべてを通過することができます。
3. 初回使用時の検出
検出はゲートウェイで、初回使用時に行われます — インストール時ではありません。
エージェントが自己インストールしたツール、MCP サーバー、またはスキルは、
その呼び出しが初めてゲートウェイを横切ったときに捕捉されます。これは意図的なものです:
ゲートウェイはケイパビリティがどのように到達したかに関わらず、すべてのプロバイダ、
すべてのエージェント、すべての呼び出しを見る唯一のチョークポイントです。
インストール時の検出を待つと、実行時にロードされたケイパビリティを見逃します。
4. ゲートウェイが見ることができないもの
検査の保証はゲートウェイを横断する呼び出しをカバーします。エージェントが 完全に自身のプロセス内で実行するツール — ローカルファイルを読み取ったり、 ライブラリ関数を呼び出したり、ゲートウェイにメッセージを送ることなく サブプロセスを実行したりするもの — には及びません。 これは設計上の欠陥ではなく、正直な境界です。設計目標は、重要な呼び出し — 現実世界への影響を持つもの — のための監査済みパスをゲートウェイにすることです:| 実行場所 | ゲートウェイは見るか? | ギャップを埋める方法 |
|---|---|---|
モデル媒介ツール呼び出し(モデルが tool_calls を発行) | はい — response サーフェス | 必要なアクションなし;既に統制されています。 |
| ファイアウォール MCP ゲートウェイ経由の MCP ディスパッチ | はい — mcp サーフェス | 必要なアクションなし;既に統制されています。 |
エージェントがディスパッチ前に POST /api/v1/firewall/evaluate を呼び出す | はい — インラインで評価 | evaluate フック経由で既に統制されています。 |
| ツールがプロセス内で実行され、ゲートウェイに接触しない | いいえ | MCP ディスパッチとネットワーク呼び出しツールを、エージェントプロセスから直接呼び出す代わりにゲートウェイ経由でルーティングします。 |
5. 検査データへのロールゲート
検査サーフェスへのアクセスはワークスペース内でロールスコープされます:| ケイパビリティ | 最低ロール |
|---|---|
| ガードレールマッチ、ファイアウォールポリシー、発見されたツールを読み取る | メンバー |
| ファイアウォールの Events & Runs フィードを読み取る | Developer |
| ガードレール、ファイアウォールポリシー、ルールを作成または変更する | Developer |
コンプライアンスエクスポート、ファイアウォールゲートウェイスコープキープレーンテキスト、is_firewall_gateway キーフラグ | Admin |
ファイアウォールゲートウェイスコープトークン(
/api/v1/firewall/evaluate と
MCP ゲートウェイを呼び出すために使用するキー)の作成には Admin ロールが必要です。
通常の API キーはそれらのルートで 403 を返します。6. 次のステップ
コントロールスタック
完全なリクエストパス — キー、ガードレール、モデル、ファイアウォール、監査 —
ひとつの図で。
責任共有
ゲートウェイが保護するものとアプリケーションに残るもの。
エージェントファイアウォール
ポリシーを作成し、サーフェスを設定し、ツール呼び出しを詳細に統制します。
