面向 AI 代理的 NIST AI RMF 對齊

你正把一個 AI 代理對齊到 NIST AI 風險管理框架,而你的審查者想看見 Govern / Map / Measure / Manage 功能由實際執行的東西支撐——而非一張意圖的試算表。NIST AI RMF 套件把框架的風險功能對應到真實的閘道防護欄、一次呼叫把它們具現化進你的工作區,並讓你在任何東西強制執行之前以觀察模式執行它們。本頁是疊在共享合規流程之上的 NIST AI RMF 特定落地頁。關於每個套件共通的機制——先觀察、方案門檻、簽署報告——請從合規總覽開始。

1. NIST AI RMF 對齊在閘道上涵蓋什麼

nist_ai_rmf 套件（NIST AI 風險管理框架 1.0,司法管轄區 US）把三個框架功能對應到內容平面防護欄。每一個都是一個真實、可編輯的規則,從你也能親手撰寫的同一個預設集程式庫建立——像任何其他防護欄一樣開啟它、讀取它、調校它。

MANAGE 2.1 —— 提示注入防禦

在請求上偵測並標記提示注入嘗試。從 Prompt-Injection Basics 預設集建立——一條關鍵字規則,在輸入階段標註常見越獄措辭（ignore previous instructions、reveal your system prompt）供審查,而不封鎖使用者。這是套件推薦的控制項。

MEASURE 2.6 —— 內容安全

標記自我傷害／不安全內容。從 Self-Harm Keywords 預設集建立,它封鎖詢問如何自我傷害的輸入階段提示。把它與你自己的升級工作流程搭配,讓一個被封鎖的請求帶著求助專線資訊浮現給人工審查者。

GOVERN 1.2 —— 治理記錄

把防護欄決策記錄為治理證據。從 Compliance Logger (observe-only) 預設集建立——它橫跨輸入與輸出記錄 PII 出現與政策決策而不封鎖或修改流量。

這些是閘道能承擔的風險功能義務:對輸入的偵測、一個安全封鎖,以及一份決策記錄。框架也要求閘道無法執行的組織性工作——你的 GOVERN 1.1 政策與問責結構——套件把它攜帶為一個 Organizational: true 列供你在閘道之外提供證據。參見共同責任。

2. 一個具體例子:安裝、觀察、上線

套件工作使用你的主控台工作階段（UserAuth）——而非中繼 sk-orca-… 金鑰。瀏覽目錄與檢查就緒度對任何工作區 Member 免費;安裝是付費方案上的工作區 Admin 動作,在伺服器端強制,因此直接 API 呼叫無法繞過門檻。

瀏覽並檢查就緒度（Member,免費）

開啟 Compliance → Frameworks 並選擇 NIST AI RMF。就緒度顯示這三個控制項在你下定決心之前如何對應到你目前的政策。

安裝套件（Admin,付費）

從主控台安裝會發出 POST /api/compliance/packs/nist_ai_rmf/install。一次呼叫把控制項具現化成一個真實、可編輯的防護欄（以套件的來源標記）——建立於觀察模式,因此它標記而非封鎖,而你在不影響即時流量的情況下收集「本來會封鎖」的證據。

POST /api/compliance/packs/nist_ai_rmf/install

觀看匹配

在 Guardrails 匹配動態（GET /api/guardrail/match,Member）中檢視 MANAGE 與 MEASURE 控制項本來會攔截什麼。在主控台調校任何規則——它是一個標準防護欄,因此每條編輯、版本與還原路徑都不變地運作。

把它上線並附加

當證據看起來合適時,把防護欄翻出觀察模式,然後透過在金鑰上設定 guardrail_id 把它附加到你代理使用的金鑰上（或讓它成為工作區預設值）。現在 MEASURE 2.6 自我傷害封鎖在計量之前對請求強制執行。

絕不把中繼 sk-orca-… 金鑰交給一條設定路由。/api/compliance/* 與 /api/guardrail/* 路由以你的主控台工作階段驗證,而非中繼金鑰——只有 /v1/* 模型呼叫使用 sk-orca-…。安裝、上線、報告與設定駐留地是受門檻的 Admin 動作。

來自 MEASURE 2.6 控制項的一個 guardrail_blocked 結果是一個不耗費配額的 HTTP 400——一個輸入階段封鎖在計量之前被攔截,且它被標記為 skip-retry,因此一個被封鎖的不安全提示永遠不會耗費花費或迴圈。

3. 交付一份簽署、可驗證的報告

當你在強制執行時,產生合規報告:一個 Ed25519 簽署、SHA-256 蓋印的產物,你可以匯出為 CSV、JSON 或 PDF 並交給審查者。任何人都能在沒有帳號的情況下驗證它。

帶有真實計數的逐功能涵蓋

每個控制項列攜帶它的狀態——covered、observe、gap 或 attested——以及它本期實際觸發了多少次。一個標記了 2,000 次注入嘗試的 MANAGE 2.1 控制項,對審查者而言讀起來不同於一個零匹配的,而報告兩者都顯示。

來源沿襲

每個具現化的控制項記錄它的 control_id（例如 nistai.injection）、逐字條款（NIST AI RMF MANAGE 2.1）、平面,以及強制執行它的即時防護欄的 id——因此審查者走訪功能 → 控制項 → 強制執行的政策 → 匹配,沒有推斷的一步。

公開驗證

在 GET /api/public/compliance/pubkey 取得簽署公鑰、把報告提交到 POST /api/public/compliance/verify,或在 GET /api/public/compliance/share/:token 開啟一個範圍限定的審查者分享連結。無需帳號。

完整的封面到頁尾版面參見簽署報告,驗證演練參見驗證一份報告。

4. 為你的 NIST AI RMF 證據蓋上地區戳記

報告被蓋印並儲存於你宣告的資料駐留地地區（us / eu / uk / ap / cn / global）;一份報告只在相符的地區下提供,而跨地區讀取會被扣留。工作區 Admin 透過 PUT /api/compliance/residency 設定它。

駐留地是合規報告產物的地區,而非推論在何處執行的地理鎖定。它控制你的簽署證據存放在哪裡與誰能讀取它,而非模型流量被路由到哪裡。參見資料駐留地與跨地區。

請求日誌預設 30 天保留（被伺服器鉗制到 180 天硬性最大值）,而一次使用者刪除執行一個 30 天寬限視窗然後一次 PII 清除——兩者在審查者詢問你保留姿態時都相關。參見保留與被遺忘權。

5. NIST AI RMF 與你方案的其餘部分並行

AI RMF 很少單獨落地。同一個安裝流程涵蓋相鄰的 AI 治理與 LLM 安全框架,每一個具現化它自己的可編輯控制項:

套件	框架
`iso_42001`	ISO/IEC 42001 AI 管理系統
`eu_ai_act`	EU 人工智慧法
`owasp_llm`	LLM 應用的 OWASP Top 10

ISO 42001

AI 管理系統證據。

EU AI Act

禁止實務、透明度、記錄保存。

OWASP LLM Top 10

高訊號的 LLM 安全風險作為一個套件。

MANAGE 2.1 提示注入控制項是閘道對你安全政策已經追蹤的同樣威脅的防禦。如果你想獨立於合規套件強化它,防護欄參考更深入。

6. 下一步去哪裡

安裝一個套件

完整的安裝機制,橫跨每個框架共享。

觀察 vs 強制執行

觀察模式如何刻意地轉成即時強制執行。

防護欄參考

NIST AI RMF 套件據以建立的內容平面控制項。

提示注入

MANAGE 2.1 控制項所防禦的威脅。

以觀察模式安裝、觀看 Map/Measure/Manage 控制項本來會攔截什麼、在你代理的金鑰上把它們上線,然後交付一份簽署報告。那就是作為一項設定而非一個專案的 NIST AI RMF 對齊。

​1. NIST AI RMF 對齊在閘道上涵蓋什麼

​2. 一個具體例子:安裝、觀察、上線

​3. 交付一份簽署、可驗證的報告

​4. 為你的 NIST AI RMF 證據蓋上地區戳記

​5. NIST AI RMF 與你方案的其餘部分並行

ISO 42001

EU AI Act

OWASP LLM Top 10

​6. 下一步去哪裡

安裝一個套件

觀察 vs 強制執行

防護欄參考

提示注入

1. NIST AI RMF 對齊在閘道上涵蓋什麼

2. 一個具體例子:安裝、觀察、上線

3. 交付一份簽署、可驗證的報告

4. 為你的 NIST AI RMF 證據蓋上地區戳記

5. NIST AI RMF 與你方案的其餘部分並行

6. 下一步去哪裡