AI エージェントのための NIST AI RMF アラインメント

AI エージェントを NIST AI リスクマネジメントフレームワークにアラインしようとしていて、レビュアーは Govern / Map / Measure / Manage 機能が、意図のスプレッドシートではなく実際に動作する何かに裏打ちされていることを見たがっています。 NIST AI RMF パックは、フレームワークのリスク機能を実在するゲートウェイガードレールにマッピングし、ひとつの呼び出しでワークスペースに実体化し、何かが強制する前に観察モードで動かせるようにします。このページは、共有されるコンプライアンスフローの上に乗る NIST AI RMF 固有のランディングです。すべてのパックが共有する仕組み — 観察ファースト、プランゲーティング、署名付きレポート — については、コンプライアンス概要から始めてください。

1. NIST AI RMF アラインメントがゲートウェイ上でカバーするもの

nist_ai_rmf パック（NIST AI リスクマネジメントフレームワーク 1.0、管轄 US）は、 3 つのフレームワーク機能をコンテンツプレーンのガードレールにマッピングします。それぞれは、あなたが手でオーサリングできるのと同じプリセットライブラリから構築された実在する編集可能なルールです — 他のどのガードレールとも同様に開いて読み、チューニングしてください。

MANAGE 2.1 — プロンプトインジェクション防御

リクエスト上でプロンプトインジェクションの試みを検出しフラグします。 Prompt-Injection Basics プリセットから構築された — よくあるジェイルブレイクのフレーズ（ignore previous instructions、reveal your system prompt）を、ユーザーをブロックせずに、入力ステージでレビューのために注釈付けするキーワードルールです。これがパックの推奨コントロールです。

MEASURE 2.6 — コンテンツ安全性

自傷 / 安全でないコンテンツをフラグします。Self-Harm Keywords プリセットから構築され、自傷の方法を尋ねる入力ステージのプロンプトをブロックします。ブロックされたリクエストがヘルプライン情報とともに人間のレビュアーに表面化するよう、あなた自身のエスカレーションワークフローと組み合わせてください。

GOVERN 1.2 — ガバナンスログ

ガードレール決定をガバナンスエビデンスとして記録します。Compliance Logger (observe-only) プリセットから構築され — トラフィックをブロックまたは変更せずに、入力と出力にわたって PII の出現とポリシー決定をログします。

これらはゲートウェイが運べるリスク機能の義務です：入力上の検出、安全性ブロック、決定記録。フレームワークはゲートウェイが実行できない組織的作業も求めます — あなたの GOVERN 1.1 ポリシーとアカウンタビリティ構造 — それをパックは、ゲートウェイの外部であなたが証拠立てるための Organizational: true 行として運びます。責任共有を参照。

2. ひとつの具体例：インストール、観察、ゴーライブ

パック作業はあなたのコンソールセッション（UserAuth）を使います — リレー sk-orca-… キーではありません。カタログの閲覧と準備状況の確認はどのワークスペース メンバーにも無料です；インストールは有料プランのワークスペース管理者 アクションで、サーバー側で強制されるため直接の API 呼び出しではゲートを回避できません。

閲覧して準備状況を確認（メンバー、無料）

Compliance → Frameworks を開いて NIST AI RMF を選びます。準備状況は、何にもコミットする前に、3 つのコントロールが現在のポリシーにどうマッピングするかを示します。

パックをインストール（管理者、有料）

コンソールからのインストールは POST /api/compliance/packs/nist_ai_rmf/install を発行します。ひとつの呼び出しが、コントロールをパックの来歴でタグ付けされた実在する編集可能なガードレールに実体化します — 観察モードで作成されるため、ブロックする代わりにフラグし、影響を与えずにライブトラフィックで「ブロックしたであろう」エビデンスを収集します。

POST /api/compliance/packs/nist_ai_rmf/install

マッチを見守る

MANAGE と MEASURE のコントロールが何を捕捉するかを Guardrails マッチフィード（GET /api/guardrail/match、メンバー）でレビューします。コンソールで任意のルールをチューニングします — それは標準のガードレールなので、すべての編集、バージョン、リバートのパスが変更なしに動作します。

ライブにしてアタッチ

エビデンスが正しく見えたらガードレールを観察モードから切り替え、それからキーに guardrail_id を設定して（またはワークスペースデフォルトにして）、エージェントが使うキーにアタッチします。これで MEASURE 2.6 自傷ブロックがメータリング前にリクエスト上で強制されます。

設定ルートにリレー sk-orca-… キーを決して渡さないでください。/api/compliance/* と /api/guardrail/* のルートは、リレーキーではなくあなたのコンソールセッションで認証します — sk-orca-… を使うのは /v1/* モデル呼び出しだけです。インストール、ゴーライブ、レポート、レジデンシーの設定がゲートされた管理者アクションです。

MEASURE 2.6 コントロールからの guardrail_blocked 結果は、クォータを消費しない HTTP 400 です — 入力ステージのブロックはメータリング前に捕捉され、skip-retry とマークされるため、ブロックされた安全でないプロンプトが支出を消費したりループしたりすることは決してありません。

3. 署名付きで検証可能なレポートを出荷する

強制しているとき、コンプライアンスレポートを生成します：Ed25519 署名、 SHA-256 スタンプされたアーティファクトで、CSV、JSON、PDF としてエクスポートしレビュアーに手渡せます。誰もがアカウントなしにそれを検証できます。

実際のカウント付きの機能ごとのカバレッジ

各コントロール行は、そのステータス — covered、observe、gap、attested — と、それが期間にわたって実際に何回発火したかを運びます。2,000 件のインジェクションの試みをフラグした MANAGE 2.1 コントロールは、マッチがゼロのものとはレビュアーに異なって読まれ、レポートは両方を示します。

来歴系統

すべての実体化されたコントロールは、その control_id（例： nistai.injection）、逐語的な条項（NIST AI RMF MANAGE 2.1）、プレーン、そしてそれを強制するライブなガードレールの id を記録します — そのためレビュアーは、推測されたステップなしに、機能 → コントロール → 強制ポリシー → マッチを歩きます。

公開検証

GET /api/public/compliance/pubkey で署名公開鍵を取得し、 POST /api/public/compliance/verify にレポートを送信するか、 GET /api/public/compliance/share/:token でスコープされたレビュアー共有リンクを開きます。アカウント不要。

完全な表紙からフッターまでのレイアウトについては署名付きレポートを、検証ウォークスルーについてはレポートを検証するを参照。

4. NIST AI RMF エビデンスをリージョンスタンプする

レポートは、宣言されたデータレジデンシーリージョン（us / eu / uk / ap / cn / global）の下でスタンプされ保存されます；レポートは一致するリージョンの下でのみ配信され、クロスリージョン読み取りは保留されます。ワークスペース管理者が PUT /api/compliance/residency 経由でそれを設定します。

レジデンシーはコンプライアンスレポートアーティファクトのリージョンであり、推論がどこで動作するかの地理的固定ではありません。それはあなたの署名付きエビデンスがどこに存在し、誰が読めるかを統制し、モデルトラフィックがどこにルーティングされるかは統制しません。データレジデンシーとクロスリージョンを参照。

リクエストログはデフォルトで 30 日保持され（180 日ハード最大値にサーバークランプ）、ユーザー削除は 30 日猶予ウィンドウ、それから PII スクラブを実行します — どちらもレビュアーがあなたの保持姿勢について尋ねるときに関連します。保持と消去権を参照。

5. NIST AI RMF をプログラムの他の部分と並べて

AI RMF が単独で着地することは稀です。同じインストールフローが、隣接する AI ガバナンスと LLM セキュリティのフレームワークをカバーし、それぞれが独自の編集可能なコントロールを実体化します：

パック	フレームワーク
`iso_42001`	ISO/IEC 42001 AI マネジメントシステム
`eu_ai_act`	EU 人工知能法
`owasp_llm`	OWASP Top 10 for LLM Applications

ISO 42001

AI マネジメントシステムのエビデンス。

EU AI Act

禁止行為、透明性、記録保持。

OWASP LLM Top 10

高シグナルの LLM セキュリティリスクをパックとして。

MANAGE 2.1 プロンプトインジェクションコントロールは、あなたのセキュリティポリシーが既に追跡しているのと同じ脅威に対するゲートウェイの防御です。コンプライアンスパックとは独立してそれを強化したいなら、ガードレールリファレンスがより深く掘り下げます。

6. 次に行く場所

パックをインストールする

すべてのフレームワークで共有される完全なインストールの仕組み。

観察 vs 強制

観察モードがどう意図的にライブ強制になるか。

ガードレールリファレンス

NIST AI RMF パックが構築されるコンテンツプレーンのコントロール。

プロンプトインジェクション

MANAGE 2.1 コントロールが防御する脅威。

観察モードでインストールし、Map/Measure/Manage コントロールが何を捕捉するかを見守り、エージェントのキーでそれらをライブにし、それから署名付きレポートを出荷します。それがプロジェクトではなく設定としての NIST AI RMF アラインメントです。

​1. NIST AI RMF アラインメントがゲートウェイ上でカバーするもの

​2. ひとつの具体例：インストール、観察、ゴーライブ

​3. 署名付きで検証可能なレポートを出荷する

​4. NIST AI RMF エビデンスをリージョンスタンプする

​5. NIST AI RMF をプログラムの他の部分と並べて

ISO 42001

EU AI Act

OWASP LLM Top 10

​6. 次に行く場所

パックをインストールする

観察 vs 強制

ガードレールリファレンス

プロンプトインジェクション

1. NIST AI RMF アラインメントがゲートウェイ上でカバーするもの

2. ひとつの具体例：インストール、観察、ゴーライブ

3. 署名付きで検証可能なレポートを出荷する

4. NIST AI RMF エビデンスをリージョンスタンプする

5. NIST AI RMF をプログラムの他の部分と並べて

6. 次に行く場所