ここでのすべての設定ステップは、コンソール(またはセッション/アクセストークンを
使った REST API)から行われ、ロールゲートされています。
sk-orca-... 形式のキーを
持つのはファイアウォールゲートウェイルートと /v1/* リレー呼び出しだけです。1. mcp server 接続を精査するチェックリスト
上から下へ作業します。最初の 3 ステップは、自分で運用しない任意のサーバーに必須です; 残りはそれを強化します。1. 信頼する前にプローブする
ルールを 1 つ書く前に、実際のツールリストと到達可能性を発見します。
2. デフォルト拒否、それから許可リスト化
レビューしたツールだけを許可します;それ以外はすべて拒否されます。
3. クレデンシャルを暗号化する
認証を、保存時に暗号化、読み取り時にマスク、モデルから決して見えないように保存
します。
4. egress をロックする
サーバーのツールがネットワーク上で到達してよい先を制約します。
5. 自己インストールされたスキルを隔離する
エージェントが自分でインストールするものは、人間がレビューするまで保留します。
6. まずシャドウ、それから監視
audit-only でロールアウトし、強制する前にイベントと異常を読みます。
2. 信頼する前にプローブする
見たことのないツールをレビューすることはできず、サーバーのアドバタイズされたツール リストは、あなたの下で最も変わりやすいものです。サーバーを登録し、それからプローブ します — ゲートウェイはエンドポイントに対して MCPinitialize + tools/list を実行し、
実際のツールをその入力スキーマとともに、加えて ok、degraded、または down の
到達可能性 status を返します。
shell.exec や http_fetch をアドバタイズするサーバーは、詳細ではなく所見です —
それがまずプローブする全目的です。
完全な登録とプローブのリファレンスは
ファイアウォール:MCP サーバーに、エンドツーエンドの
ウォークスルーはMCP サーバーの接続にあります。
3. デフォルト拒否、それからレビューしたツールを許可リスト化する
許可リストは、「サーバーは 6 つのことができる」と「サーバーはその運用者が明日決める ことなら何でもできる」の違いです。ポリシーのdefault_verdict を deny に設定し、
それからレビューして信頼したツールごとにルールを追加します。ゲートウェイはすべての
ツールを <server>.<tool> で名前空間化するため、他のものに触れずに 1 つのサーバーに
ルールをスコープできます。
github.create_issue は実行され、github.get_issue は実行され、新たに導入
された github.delete_repo は、あなたがレビューして許可するまで拒否されます。拒否
された tools/call は、ツールエラー(firewall deny: …)としてモデルに戻ります —
エージェントはクラッシュする代わりに適応します。
完全なレシピについては
MCP ツールの許可リスト化を、マッチング DSL
についてはファイアウォールルールを参照してください。
4. クレデンシャルを暗号化する — 認証を手作りしない
サードパーティサーバーはほとんど常にクレデンシャルを必要とし、クレデンシャルは あなたが最も平文で置きたくない、あるいはモデルに到達させたくないものです。サーバーの 認証を OrcaRouter 経由で登録して、保存時に暗号化、読み取り時にマスク、ディスパッチ時 にのみ注入されるようにします。auth_mode は none、bearer、oauth、または basic のいずれかです:
5. egress をロックする:そのツールはどこに到達できるか?
呼び出しごとの判定はどのツールが実行されるかを決めます;egress はどこに到達して よいかを決めます。「データを返す」ツールと「あなたのシークレットを攻撃者のホストに 持ち出す」ツールは、引数が異なるだけの同じツールでありうる — egress 制御がそれらを 見分けるものです。 ゲートウェイはすでに、すべてのリモートエンドポイントとその解決されたダイヤル IP を、 すべてのホップで SSRF ポリシーに対して検証し、イントラネット範囲とクラウドメタデータ アドレスを拒否し、DNS リバインディングを打ち破るために IP を再チェックします。その上 に、このサーバーが決して触れるべきでないホストと CIDR のために、独自の egress deny ルールを作成します:6. エージェントが自分でインストールするものを隔離する
登録したサーバーはひとつのリスクです;エージェントがその後自己インストールする スキル、BYO MCP サーバー、プラグインは別のものです。OrcaRouter は、インストール可能な すべてのケイパビリティをスキャンし、リスクバンドを割り当て、強制モード —allow、
quarantine、または block — を導出します。それはすべてのルール判定の上に乗ります。
初回使用で自動検出されたものはすべて、人間がレビューするまで隔離されます:誰も
承認していないケイパビリティは、良性にスキャンされたというだけでフリーパスを得ません。
quarantine のケイパビリティは、deny に満たないものはすべて pending_approval に
エスカレートするため、そのツールはあなたが見た後にのみ実行されます。
7. まずシャドウ、それからトレイルを監視する
真新しいサーバーをいきなり強制に切り替えないでください。ポリシーをシャドウモード に置きます — 強制判定は audit にダウングレードされ[shadow] would … としてログに
記録されます — そうすれば、実際にブロックされる前に何がブロックされただろうかを
見られます。監査トレイルが正しく見えたら、シャドウモードを外して強制します。
ライブになった後も、制御は監視を続けます:
ファイアウォールイベント
ファイアウォールイベント
すべての統制された呼び出しは、その判定、サーフェス、マッチしたルールを記録します。
許可リストと egress ルールが意図通りに振る舞うことを確認するためにそれらを読み
ます。MCP イベントの監査を参照してください。
異常フィード
異常フィード
学習されたベースラインに対する頻度とコストのスパイク、加えてリトライループと新規の
ツールパスが、異常として表面化します — 任意の Member が読めます。
発見されたツール
発見されたツール
observe モードをオンにして、ポリシーがまだカバーしていない呼び出しをギャップとして
ログに記録し、推測からではなく、エージェントが実際にすることから厳格化します。
8. 高速パス:自律性レベルを選ぶ
完全には信頼しないサーバーのためにステップ 3〜5 を手で組み立てたくないなら、自律性 レベルを適用してそこから編集します。レベルは実際の編集可能なポリシーとガードレールの 行を書きます — それらはブラックボックスではなく出発点です:| レベル | 設定するもの |
|---|---|
permissive | observe モードオン — すべてをログに記録し、何も強制しません。 |
balanced | 破壊的シェルを拒否するデフォルト audit ポリシー、加えて flag-only モードの PII Shield ガードレール。 |
tight | 破壊的シェルと fetch 形状のツール(http_fetch/web_search/fetch_url/request — SSRF ベクター)を拒否するデフォルト拒否ポリシー、加えて強制された PII Shield と Secrets Blocker ガードレール。引数内のシークレットは、ツール引数ルールではなく、リクエストに対する Secrets Blocker ガードレールによって捕捉されます。 |
tight から始め、プローブし、それから特定の
ツールを許可リストに緩めます。ワンクリックの取り消しは、適用前のスナップショットを
復元します。
設定、ポリシー、発見されたツール、異常、登録済み MCP サーバー、スキルの読み取りは
任意の Member に開放されています;イベント、ラン、集計の読み取りには Developer+
が必要で、すべての書き込みには Developer+ が必要です。トークンの平文キーを明らかに
することも Developer+ です。
9. 次のステップ
MCP サーバーの接続
サーバーを登録、プローブし、ゲートウェイ経由で公開します。
MCP ツールの許可リスト化
サーバーをデフォルト拒否にし、レビューしたツールだけを許可します。
ラグプル防御
承認後に変化するサーバーまたはスキルを捕捉します。
MCP セキュリティ概要
MCP 統制サーフェスの完全な地図。
