1. NIST AI RMF アラインメントがゲートウェイ上でカバーするもの
nist_ai_rmf パック(NIST AI リスクマネジメントフレームワーク 1.0、管轄 US)は、
3 つのフレームワーク機能をコンテンツプレーンのガードレールにマッピングします。
それぞれは、あなたが手でオーサリングできるのと同じプリセットライブラリから構築
された実在する編集可能なルールです — 他のどのガードレールとも同様に開いて読み、
チューニングしてください。
MANAGE 2.1 — プロンプトインジェクション防御
MANAGE 2.1 — プロンプトインジェクション防御
リクエスト上でプロンプトインジェクションの試みを検出しフラグします。
Prompt-Injection Basics プリセットから構築された — よくあるジェイルブレイク
のフレーズ(
ignore previous instructions、reveal your system prompt)を、
ユーザーをブロックせずに、入力ステージでレビューのために注釈付けするキーワード
ルールです。これがパックの推奨コントロールです。MEASURE 2.6 — コンテンツ安全性
MEASURE 2.6 — コンテンツ安全性
自傷 / 安全でないコンテンツをフラグします。Self-Harm Keywords プリセット
から構築され、自傷の方法を尋ねる入力ステージのプロンプトをブロックします。
ブロックされたリクエストがヘルプライン情報とともに人間のレビュアーに表面化
するよう、あなた自身のエスカレーションワークフローと組み合わせてください。
GOVERN 1.2 — ガバナンスログ
GOVERN 1.2 — ガバナンスログ
ガードレール決定をガバナンスエビデンスとして記録します。Compliance Logger
(observe-only) プリセットから構築され — トラフィックをブロックまたは変更
せずに、入力と出力にわたって PII の出現とポリシー決定をログします。
これらはゲートウェイが運べるリスク機能の義務です:入力上の検出、安全性
ブロック、決定記録。フレームワークはゲートウェイが実行できない組織的作業も求めます
— あなたの GOVERN 1.1 ポリシーとアカウンタビリティ構造 — それをパックは、ゲート
ウェイの外部であなたが証拠立てるための
Organizational: true 行として運びます。
責任共有を参照。2. ひとつの具体例:インストール、観察、ゴーライブ
パック作業はあなたのコンソールセッション(UserAuth)を使います — リレーsk-orca-… キーではありません。カタログの閲覧と準備状況の確認はどのワークスペース
メンバーにも無料です;インストールは有料プランのワークスペース管理者
アクションで、サーバー側で強制されるため直接の API 呼び出しではゲートを回避でき
ません。
閲覧して準備状況を確認(メンバー、無料)
Compliance → Frameworks を開いて NIST AI RMF を選びます。準備状況は、
何にもコミットする前に、3 つのコントロールが現在のポリシーにどうマッピングする
かを示します。
パックをインストール(管理者、有料)
コンソールからのインストールは
POST /api/compliance/packs/nist_ai_rmf/install を発行します。ひとつの呼び出し
が、コントロールをパックの来歴でタグ付けされた実在する編集可能なガードレールに
実体化します — 観察モードで作成されるため、ブロックする代わりにフラグし、
影響を与えずにライブトラフィックで「ブロックしたであろう」エビデンスを収集
します。マッチを見守る
MANAGE と MEASURE のコントロールが何を捕捉するかを Guardrails マッチフィード
(
GET /api/guardrail/match、メンバー)でレビューします。コンソールで任意の
ルールをチューニングします — それは標準のガードレールなので、すべての編集、
バージョン、リバートのパスが変更なしに動作します。3. 署名付きで検証可能なレポートを出荷する
強制しているとき、コンプライアンスレポートを生成します:Ed25519 署名、 SHA-256 スタンプされたアーティファクトで、CSV、JSON、PDF としてエクスポートし レビュアーに手渡せます。誰もがアカウントなしにそれを検証できます。実際のカウント付きの機能ごとのカバレッジ
実際のカウント付きの機能ごとのカバレッジ
各コントロール行は、そのステータス —
covered、observe、gap、attested
— と、それが期間にわたって実際に何回発火したかを運びます。2,000 件のインジェ
クションの試みをフラグした MANAGE 2.1 コントロールは、マッチがゼロのものとは
レビュアーに異なって読まれ、レポートは両方を示します。来歴系統
来歴系統
すべての実体化されたコントロールは、その
control_id(例:
nistai.injection)、逐語的な条項(NIST AI RMF MANAGE 2.1)、プレーン、そして
それを強制するライブなガードレールの id を記録します — そのためレビュアーは、
推測されたステップなしに、機能 → コントロール → 強制ポリシー → マッチを歩きます。公開検証
公開検証
4. NIST AI RMF エビデンスをリージョンスタンプする
レポートは、宣言されたデータレジデンシーリージョン(us / eu / uk /
ap / cn / global)の下でスタンプされ保存されます;レポートは一致するリージョン
の下でのみ配信され、クロスリージョン読み取りは保留されます。ワークスペース管理者が
PUT /api/compliance/residency 経由でそれを設定します。
リクエストログはデフォルトで 30 日保持され(180 日ハード最大値にサーバークランプ)、
ユーザー削除は 30 日猶予ウィンドウ、それから PII スクラブを実行します — どちらも
レビュアーがあなたの保持姿勢について尋ねるときに関連します。
保持と
消去権を参照。
5. NIST AI RMF をプログラムの他の部分と並べて
AI RMF が単独で着地することは稀です。同じインストールフローが、隣接する AI ガバナンスと LLM セキュリティのフレームワークをカバーし、それぞれが独自の編集可能な コントロールを実体化します:| パック | フレームワーク |
|---|---|
iso_42001 | ISO/IEC 42001 AI マネジメントシステム |
eu_ai_act | EU 人工知能法 |
owasp_llm | OWASP Top 10 for LLM Applications |
ISO 42001
AI マネジメントシステムのエビデンス。
EU AI Act
禁止行為、透明性、記録保持。
OWASP LLM Top 10
高シグナルの LLM セキュリティリスクをパックとして。
6. 次に行く場所
パックをインストールする
すべてのフレームワークで共有される完全なインストールの仕組み。
観察 vs 強制
観察モードがどう意図的にライブ強制になるか。
ガードレールリファレンス
NIST AI RMF パックが構築されるコンテンツプレーンのコントロール。
プロンプトインジェクション
MANAGE 2.1 コントロールが防御する脅威。
