owasp_llm)として出荷します — チェックリストビュー
だけではありません。それをインストールすると、各リスクがマッピングするガードレール
ルールとファイアウォールポリシーが、すべての api.orcarouter.ai へのリクエストが
既に横切るのと同じパス上に実体化され、何が捕捉されたかを監査人に手渡せる署名付き
レポートにスナップショットします。
このページは、カバーされる各 OWASP LLM リスクを、それを強制する OrcaRouter
コントロールにマッピングし、パックのインストール方法を示し、各コントロールの詳細
リファレンスにリンクします。すべてのフレームワークにわたるインストールからゴー
ライブまでの流れについては、コンプライアンス概要から
始めてください。
1. OWASP LLM Top 10 を OrcaRouter コントロールにマッピング
owasp_llm パックは、実在するポリシーとしてインストールされるコントロール
マッピングです — 下記の各エントリは、意図の記述ではなくゲートウェイが強制する
コントロールです。高シグナルのリスクはライブなガードレールとファイアウォール
ポリシーにマッピングします;ひとつのリスク(LLM05)はゲートウェイ強制サーフェスの
ない組織的コントロールです。
LLM01 — プロンプトインジェクション
LLM01 — プロンプトインジェクション
リクエスト入力上のガードレール。パックは Prompt-Injection Basics 安全性
プリセット(キーワードフラグ)を、ジェイルブレイク regex ルール(DAN/STAN/AIM
モードに加えて Unicode タグバイトの隠しテキスト密輸)と組み合わせて、直接的で
難読化されたインジェクションの試みを捕捉します。セマンティックなインジェクション
意図のために
llm_judge ルールと組み合わせてください。
プロンプトインジェクションと
ジェイルブレイクを参照。LLM02 — 安全でない出力処理
LLM02 — 安全でない出力処理
出力ステージ上のガードレールで、古典的な SQL インジェクションペイロード
(
UNION SELECT、OR 1=1、DROP TABLE)を含むモデルレスポンスを、それらを
自動実行するかもしれない下流システムに到達する前にブロックします。マッチは
ガードレールマッチフィードでレビューします。LLM05 — サプライチェーン
LLM05 — サプライチェーン
組織的コントロール — あなたのモデル、データ、依存関係のためのサプライチェーン
保証は、あなたが所有するプロセスであり、リクエスト時のゲートウェイチェックでは
ありません。パックはそれをレポート内のエビデンスとして運ぶため、監査人はそれが
考慮されているのを見ます。サードパーティツールのランタイム側については、
AI エージェントのセキュリティを参照。
LLM06 — 機密情報開示
LLM06 — 機密情報開示
2 つのガードレール:Secrets & API-Key Blocker(AWS / OpenAI / GitHub の
認証情報を運ぶリクエストを拒否)と厳格な PII Blocker(email、電話番号、SSN、
クレジットカード、IP を運ぶリクエストを拒否)。両方とも、プロバイダに到達する前に
リクエスト上でハードリジェクトします。ガードレールの
PII とシークレットのセクションを参照。
LLM07 — システムプロンプト漏洩
LLM07 — システムプロンプト漏洩
出力ステージ上のガードレールで、チャットテンプレートのコントロールトークン
(
<|system|>、<|im_start|>)をエコーするモデルレスポンスをブロックします
— システムプロンプトが漏れ返されている明確なエビデンスです。ルールをチューニング
し、そのヒットをマッチフィードでレビューします。LLM08 — 過剰なエージェンシー
LLM08 — 過剰なエージェンシー
危険なシェル / exec クラスのツール呼び出しを拒否するファイアウォールポリシー
ルール — アクションプレーンのコントロールです。ここが、コンテンツガードレール
ではなくファイアウォールが作業をする場所です:モデルが発行するツール呼び出しを
評価します。危険なツール呼び出しと
過剰なエージェンシーを参照。
パックは、具体的なゲートウェイ強制サーフェスを持つ OWASP リストの高シグナルの
サブセットをカバーします — 強制されるコントロールとしての LLM01、LLM02、LLM06、
LLM07、LLM08、加えて組織的エビデンスとしての LLM05。完全にあなた自身のアプリケーション
コードに存在するリスク(モデル窃取、訓練データ汚染)はゲートウェイのパスの外であり、
あなたが対処するもののままです — 責任共有を参照。
2. なぜひとつのコントロールではなくガードレールとファイアウォールか
OWASP LLM リストは 2 つの異なるプレーンにまたがり、OrcaRouter はそのコントロールを 同じ線に沿って分割します: ガードレールはプロンプトとレスポンスのテキストをスクリーニングします;ファイア ウォールはツール呼び出しとアウトバウンドアクションを評価します。過剰な エージェンシー(LLM08)はアクションの問題なので、コンテンツフィルターではなく ファイアウォールルールにマッピングします。分割が全体の眼目です:単一のコントロール が両方をカバーできない理由については ガードレール vs ファイアウォールを 読んでください。3. パックをインストールする
カタログと準備状況の閲覧はどのワークスペースメンバーにも無料です。パックの インストールはガードレールとファイアウォールポリシーを実体化し、有料プランに ゲートされたワークスペース管理者アクションです。コンソールから行います — Compliance → Catalog → OWASP LLM Top-10 → Install。 インストールは、ワークスペースに実在する編集可能なガードレールルールと ファイアウォールポリシーを作成します。それらは後でチューニングするあなたのものです — PII エンティティリストを調整し、エージェントの挙動を学ぶ間 LLM08 の deny をaudit 判定に交換し、または LLM01 のキーワード/regex ベースの上に llm_judge
インジェクションルールを追加します。ガードレールを guardrail_id 経由で、ファイア
ウォールポリシーを firewall_policy_id 経由でキーにアタッチするか、いずれかを
ワークスペースデフォルトに設定します。
4. 署名付きレポートで証明する
示せないカバレッジはカバレッジではありません。パックが動作したら、コンプライアンス レポートを生成します — それは Ed25519 署名され SHA256 スタンプされ、CSV / JSON / PDF としてエクスポート可能で、OrcaRouter アカウントなしに公的に検証可能です。署名付きレポートを生成する
レポートが何をスナップショットし、どう署名されるか。
レポートを検証する
監査人に公開検証エンドポイントを手渡す — アカウント不要。
5. 次に行く場所
コンプライアンス概要
完全なインストール → 強制 → レポート → ゴーライブの流れ。
パックの中身
パックのコントロールがどうガードレールとファイアウォールポリシーになるか。
すべてのフレームワーク
カタログ内の他の AI、セキュリティ、プライバシーのパック。
AI エージェントのセキュリティ
これらのリスクに対してエージェントを端から端まで強化するベースライン。
