AI サプライチェーンセキュリティのユースケースランディング
です;ファイアウォールと
スキルのリファレンスが完全なメカニクスを運びます。
1. ゲートウェイでのエージェントのための AI サプライチェーンセキュリティ
チョークポイントはリレーパスです。ケイパビリティが手動登録されたか、エージェントによって 自動インストールされたか、コミュニティレジストリから引っ張られたかに関わらず、その 最初のツール呼び出しはapi.orcarouter.ai を横切ります — そしてそこでファイアウォールが
それを評価します。4 つのコントロールが単一の姿勢に組み合わさります:
MCP ゲートウェイ、呼び出しごとの eval
すべての
tools/call は、ディスパッチ前にあなたのポリシーに対して評価されます —
マニフェストは決して真実の源ではありません。スキルリスク帯域 & 隔離
インストールされたケイパビリティは、スキャンされ、スコアリングされ、人間が承認する
までレビューのために保留されます。
暗号化された MCP クレデンシャル
サーバー認証シークレットは保存時に暗号化され、ディスパッチ時に注入されます —
モデル、エージェント、呼び出し引数に決して公開されません。
egress 許可リスト
ツール呼び出しがデータを送ってよい場所を固定し、侵害された依存関係が一度も承認しなかった
ホストに持ち出せないようにします。
検出はゲートウェイで、初回使用時に行われます — パッケージマネージャやファイルシステムの
内部ではありません。これは意図的なものです:ケイパビリティがどのようにそこへ到達したかに
関わらず、すべてのエージェントとすべてのツール呼び出しを見る唯一のパスなのです。
2. 脅威:信頼した後に成長する依存関係
| ベクトル | 何が起きるか |
|---|---|
| ラグプル | 登録された MCP サーバーが、一度も承認しなかったツール(shell.exec、新しい fetch)を追加します。 |
| スキルクリープ | インストールされたスキルが、マニフェストが一度も宣言しなかったツールやホストを使います。 |
| クレデンシャル窃取 | 侵害されたサーバーのツール実装が、自身の認証シークレットを読んでホームに電話します。 |
| egress 持ち出し | retrieve→send チェーンがあなたのデータを攻撃者制御のホストに送ります。 |
3. ひとつの具体例 — MCP サーバーの登録と固定
サードパーティの MCP サーバーをコンソールから登録します(Settings → Firewall → MCP servers;書き込みには Developer+ が必要)。サーバーの認証シークレットは暗号化保存 されます — あなたが一度供給すると、ゲートウェイがディスパッチ時にそれを注入し、それ以降の すべての読み取りでマスクされます。 MCP サーバーレコードは次を運びます:| フィールド | 値 |
|---|---|
auth_mode | none、bearer、oauth、basic |
status | ok、degraded、down(ヘルスプローブが設定) |
credentials | 保存時に暗号化、平文では決して返されない |
/api/workspace/firewall/*)操作であり、リレーキー
ではありません — 登録、プローブ、ルール記述はすべて管理プレーンで行われます:
tool_name_glob: <server>.* を持つファイアウォール
ルールを pending_approval にスコープします — そのサーバーからのすべての呼び出しが、
実行される前に人間のために保留されます。信頼したら、ルールを audit または allow に
緩めます。それ以降、MCP ゲートウェイが、ディスパッチ前に mcp サーフェスですべての
tools/call を評価します — そのため、後でラグプルが宣言されていないツールを追加しても、
サーバーのマニフェストではなくあなたのポリシーが、それが実行されるかどうかを決めます。
4. スキルリスク帯域 & 隔離
インストール可能なすべてのケイパビリティ — あなたが登録したか、ゲートウェイが実行時に 自動検出したかに関わらず — は、スキルスキャナを通されます。 発見はリスク帯域と強制モードにロールアップされます:リスク帯域
リスク帯域
low · medium · high · critical。帯域は、マニフェストと宣言されたスコープに
対する決定的なスキャナパス(宣言されていないツール使用、承認済みスコープ外のネットワーク
egress、安全でないファイルシステム書き込み、インジェクション形状のマニフェストテキスト)
から導出されます。強制モード
強制モード
allow(あなたのポリシールールが決定)、quarantine(deny 以外の判定が
pending_approval にエスカレート — 人間が各呼び出しを承認)、block(ルールに
関わらずこのスキルのすべてのツールに deny を強制)。high 帯域のスキルは自動的に
隔離されます;critical はブロックします。なぜ自動検出 = 常に隔離か
なぜ自動検出 = 常に隔離か
エージェントが自己インストールしたケイパビリティ、あるいはラグプルが追加したツールは、
人間がレビューするまで、スキャンスコアに関わらず
pending_approval に保留されます。
オペレーターがひそかにツールを追加し、あなたのエージェントに使い始めさせることは
できません。5. egress 許可リスト — 「ホームへの電話」を封じ込める
最も損害の大きいサプライチェーンの結果は、持ち出す侵害された依存関係です。ファイアウォールのegress サーフェスは、ツールが報告するアウトバウンドの宛先(host / IP / CIDR)を評価
するため、データがどこへ行ってよいかを固定できます。
egress ルールは自分で記述します:cidr_match 述語を持つ host/CIDR 許可リストが、
リスト外のすべてを deny します。retrieve→egress チェーンを断ち切るシーケンスルールと
組み合わせると、取得されたドキュメントを未知のホストに送ろうとする汚染されたツールは、
ゲートウェイで deny されます。
6. 暗号化されたクレデンシャル — 侵害されたサーバーがあなたのキーを読めない
サーバー認証シークレットは保存時に暗号化され、ディスパッチ時にゲートウェイによって注入 されます。モデル、エージェント、ツール呼び出し引数に決して到達しません — そのため、 侵害された、あるいは悪意あるサーバーは、自身のクレデンシャルブロブを読むことで API キーを 持ち出せません。コンソールは常にシークレットをマスクして返します — Admin に対してさえ。 復号された値はちょうどひとつのパスで渡されます:firewall-gateway-scoped トークン (Admin が明示的にゲートウェイ/プロキシのために発行する専用のトークン型)を運ぶ リクエスト。そのため、通常の漏洩したリレーキーがあなたの MCP クレデンシャルを列挙する ことはできません。7. 監査のためにまとめる
サプライチェーン統制は監査アーティファクトでもあります。OrcaRouter は、コンプライアンス エンジンの一部として、soc2、iso_27001、iso_42001、nist_ai_rmf、eu_ai_act などの
フレームワークと並んで、OWASP Top 10 for LLM Applications — LLM05 Supply Chain
コントロールを含む — にマップします。
コンプライアンスパックのインストール
(POST /api/compliance/packs/:key/install、ワークスペース Admin、有料プラン)は、
マッチするガードレールとファイアウォールポリシーを具現化し、observe-first の姿勢で開始
します。コンプライアンスレポートには AI サプライチェーン証拠セクション — ワークスペースが
実際にルーティングしたアップストリームプロバイダ、加えて特権アクセスとキーハイジーンの
レビュー — が含まれ、Ed25519 署名され公開検証可能です。カタログと準備状況の閲覧は
すべての Member に無料です;完全なライフサイクルについては
コンプライアンスを参照してください。
MCP 統制は 2 つの補完的な層です:
mcp サーフェスでの呼び出しごとのファイアウォール評価
(依存関係がすることに対する強制)、加えてツールスキーマ整合性ベースライン
(アドバタイズされたツールセットのトラストオンファーストユースハッシュ、すべてのプローブで
再チェック — ドリフトがサーバーの schema_status を changed に切り替え、管理者が再
ベースライン化または隔離するまでディスパッチをフェイルクローズします)。スキルリスク
帯域と隔離と合わせて、それは依存関係がすることと、それが宣言したものの検証可能な記録の
両方に対する強制です。8. サプライチェーンベースライン
新しい MCP サーバーやスキルを信頼する前に
新しい MCP サーバーやスキルを信頼する前に
登録し、そのツールセットをプローブし、
<server>.* ルールを pending_approval または
audit にスコープします。スキャンの発見を読みます — 宣言されていないツールや外部
egress の発見はいずれも、隔離を維持する理由です。エンドポイント URL を誰が制御して
いるかを検証します。定常状態で
定常状態で
fetch/search/export ツールを持つどのエージェントにも、egress 許可リストを固定して
おきます。ルールなしで現れたケイパビリティについては
Discovered toolsビューを、新規のツール間パスについては
異常フィードを監視します。
ラグプルが疑われた後
ラグプルが疑われた後
サーバーを無効化します(
PUT .../mcp_servers、"enabled": false) — そのクレデンシャルは
無効化中は決して復号されません。再プローブして新しいツールを表面化し、スキルを再
スキャンし、一括承認するのではなく pending_approval キューをレビューします。9. 関連する脅威 & コンセプト
- MCP ツールポイズニング & ラグプル — 悪意ある、ハイジャックされた MCP サーバーの詳細な掘り下げ。
- データ持ち出し — ツール呼び出しがデータを 送ってよい場所を制限する egress ルール。
- 危険なツール呼び出し — ツールがどこから 来たかに関わらず破壊的アクションをブロックします。
- シークレット漏洩 — クレデンシャルをプロンプト、 引数、ログの外に保ちます。
- AI エージェントのセキュリティと コントロールスタック — これらのコントロールが より広い姿勢にどう収まるか。
ファイアウォール:MCP サーバー
MCP サーバーをゲートウェイの背後に登録し、ツールをプローブし、任意の呼び出しが本物の
サーバーに到達する前に呼び出しごとの判定を適用します。
ファイアウォール:スキル
インストール可能なすべてのケイパビリティをスキャンしリスクスコアリングします。リスクの
あるスキルを、そのツールが実行される前に隔離またはブロックします。
