メインコンテンツへスキップ
セキュリティチームが「これは OWASP LLM Top 10 に対してどう持ちこたえるか?」と 尋ねるとき、あなたはスライドではなく、動作するコントロールを指す答えを欲しがり ます。OrcaRouter は OWASP Top 10 for LLM Applications を実在するインストール 可能なコンプライアンスパック(owasp_llm)として出荷します — チェックリストビュー だけではありません。それをインストールすると、各リスクがマッピングするガードレール ルールとファイアウォールポリシーが、すべての api.orcarouter.ai へのリクエストが 既に横切るのと同じパス上に実体化され、何が捕捉されたかを監査人に手渡せる署名付き レポートにスナップショットします。 このページは、カバーされる各 OWASP LLM リスクを、それを強制する OrcaRouter コントロールにマッピングし、パックのインストール方法を示し、各コントロールの詳細 リファレンスにリンクします。すべてのフレームワークにわたるインストールからゴー ライブまでの流れについては、コンプライアンス概要から 始めてください。

1. OWASP LLM Top 10 を OrcaRouter コントロールにマッピング

owasp_llm パックは、実在するポリシーとしてインストールされるコントロール マッピングです — 下記の各エントリは、意図の記述ではなくゲートウェイが強制する コントロールです。高シグナルのリスクはライブなガードレールとファイアウォール ポリシーにマッピングします;ひとつのリスク(LLM05)はゲートウェイ強制サーフェスの ない組織的コントロールです。
リクエスト入力上のガードレール。パックは Prompt-Injection Basics 安全性 プリセット(キーワードフラグ)を、ジェイルブレイク regex ルール(DAN/STAN/AIM モードに加えて Unicode タグバイトの隠しテキスト密輸)と組み合わせて、直接的で 難読化されたインジェクションの試みを捕捉します。セマンティックなインジェクション 意図のために llm_judge ルールと組み合わせてください。 プロンプトインジェクションジェイルブレイクを参照。
出力ステージ上のガードレールで、古典的な SQL インジェクションペイロード (UNION SELECTOR 1=1DROP TABLE)を含むモデルレスポンスを、それらを 自動実行するかもしれない下流システムに到達する前にブロックします。マッチは ガードレールマッチフィードでレビューします。
組織的コントロール — あなたのモデル、データ、依存関係のためのサプライチェーン 保証は、あなたが所有するプロセスであり、リクエスト時のゲートウェイチェックでは ありません。パックはそれをレポート内のエビデンスとして運ぶため、監査人はそれが 考慮されているのを見ます。サードパーティツールのランタイム側については、 AI エージェントのセキュリティを参照。
2 つのガードレール:Secrets & API-Key Blocker(AWS / OpenAI / GitHub の 認証情報を運ぶリクエストを拒否)と厳格な PII Blocker(email、電話番号、SSN、 クレジットカード、IP を運ぶリクエストを拒否)。両方とも、プロバイダに到達する前に リクエスト上でハードリジェクトします。ガードレールの PII とシークレットのセクションを参照。
出力ステージ上のガードレールで、チャットテンプレートのコントロールトークン (<|system|><|im_start|>)をエコーするモデルレスポンスをブロックします — システムプロンプトが漏れ返されている明確なエビデンスです。ルールをチューニング し、そのヒットをマッチフィードでレビューします。
危険なシェル / exec クラスのツール呼び出しを拒否するファイアウォールポリシー ルール — アクションプレーンのコントロールです。ここが、コンテンツガードレール ではなくファイアウォールが作業をする場所です:モデルが発行するツール呼び出しを 評価します。危険なツール呼び出し過剰なエージェンシーを参照。
パックは、具体的なゲートウェイ強制サーフェスを持つ OWASP リストの高シグナルの サブセットをカバーします — 強制されるコントロールとしての LLM01、LLM02、LLM06、 LLM07、LLM08、加えて組織的エビデンスとしての LLM05。完全にあなた自身のアプリケーション コードに存在するリスク(モデル窃取、訓練データ汚染)はゲートウェイのパスの外であり、 あなたが対処するもののままです — 責任共有を参照。

2. なぜひとつのコントロールではなくガードレールとファイアウォールか

OWASP LLM リストは 2 つの異なるプレーンにまたがり、OrcaRouter はそのコントロールを 同じ線に沿って分割します:
プレーンカバーコントロール
コンテンツLLM01, LLM02, LLM06, LLM07ガードレール
アクションLLM08ファイアウォール
ガードレールはプロンプトとレスポンスのテキストをスクリーニングします;ファイア ウォールはツール呼び出しとアウトバウンドアクションを評価します。過剰な エージェンシー(LLM08)はアクションの問題なので、コンテンツフィルターではなく ファイアウォールルールにマッピングします。分割が全体の眼目です:単一のコントロール が両方をカバーできない理由については ガードレール vs ファイアウォールを 読んでください。

3. パックをインストールする

カタログと準備状況の閲覧はどのワークスペースメンバーにも無料です。パックの インストールはガードレールとファイアウォールポリシーを実体化し、有料プランに ゲートされたワークスペース管理者アクションです。コンソールから行います — Compliance → Catalog → OWASP LLM Top-10 → Install
まず非本番ワークスペースでインストールするか、実体化されたファイアウォールポリシーを shadow_mode でアタッチして、強制判定が拒否する代わりに [shadow] would … として ログされるようにします。ファイアウォールイベントとガードレールマッチフィードを 1 週間見守り、それからマッチが正しく見えたら強制に昇格します。
インストールは、ワークスペースに実在する編集可能なガードレールルールと ファイアウォールポリシーを作成します。それらは後でチューニングするあなたのものです — PII エンティティリストを調整し、エージェントの挙動を学ぶ間 LLM08 の deny を audit 判定に交換し、または LLM01 のキーワード/regex ベースの上に llm_judge インジェクションルールを追加します。ガードレールを guardrail_id 経由で、ファイア ウォールポリシーを firewall_policy_id 経由でキーにアタッチするか、いずれかを ワークスペースデフォルトに設定します。

4. 署名付きレポートで証明する

示せないカバレッジはカバレッジではありません。パックが動作したら、コンプライアンス レポートを生成します — それは Ed25519 署名され SHA256 スタンプされ、CSV / JSON / PDF としてエクスポート可能で、OrcaRouter アカウントなしに公的に検証可能です。

署名付きレポートを生成する

レポートが何をスナップショットし、どう署名されるか。

レポートを検証する

監査人に公開検証エンドポイントを手渡す — アカウント不要。
レポートは各 OWASP LLM コントロール、それを裏打ちするルール、そしてレポートウィンドウ で捕捉したマッチを一覧します — そのため「これは OWASP LLM Top 10 に対してどう 持ちこたえるか?」への答えは、口頭の保証ではなく署名付きアーティファクトです。

5. 次に行く場所

コンプライアンス概要

完全なインストール → 強制 → レポート → ゴーライブの流れ。

パックの中身

パックのコントロールがどうガードレールとファイアウォールポリシーになるか。

すべてのフレームワーク

カタログ内の他の AI、セキュリティ、プライバシーのパック。

AI エージェントのセキュリティ

これらのリスクに対してエージェントを端から端まで強化するベースライン。
OrcaRouter 上の OWASP LLM カバレッジは、チェックリストではなく動作するポリシーです: ひとつのインストールが各リスクがマッピングするガードレールとファイアウォールルールを 配線し、ひとつのレポートがそれらが発火したことを証明します。