AI 에이전트를 위한 NIST AI RMF 정렬

AI 에이전트를 NIST AI Risk Management Framework에 정렬하고 있고 검토자가 Govern / Map / Measure / Manage 기능이 실제로 실행되는 무언가로 — 의도의 스프레드시트가 아니라 — 뒷받침됨을 보고 싶어 합니다. NIST AI RMF 팩은 프레임워크의 위험 기능을 실제 게이트웨이 guardrail에 매핑하고, 한 번의 호출로 워크스페이스에 구체화하며, 어떤 것이 강제하기 전에 관찰 모드에서 실행하게 합니다. 이 페이지는 공유 컴플라이언스 흐름 위의 NIST AI RMF 특화 랜딩입니다. 모든 팩이 공통으로 가진 메커니즘 — 관찰 우선, 플랜 게이팅, 서명된 보고서 — 은 컴플라이언스 개요에서 시작하세요.

1. NIST AI RMF 정렬이 게이트웨이에서 커버하는 것

nist_ai_rmf 팩(NIST AI Risk Management Framework 1.0, 관할권 US)은 세 프레임워크 기능을 콘텐츠 평면 guardrail에 매핑합니다. 각각은 당신이 손으로 작성할 수 있는 동일한 프리셋 라이브러리에서 빌드된 실제로 편집 가능한 규칙입니다 — 다른 어떤 guardrail처럼 그것을 열고, 읽고, 튜닝하세요.

MANAGE 2.1 — 프롬프트 인젝션 방어

요청에서 프롬프트 인젝션 시도를 탐지하고 플래그합니다. Prompt-Injection Basics 프리셋에서 빌드됨 — 일반적인 탈옥 문구(ignore previous instructions, reveal your system prompt)를 사용자를 차단하지 않고 검토를 위해 input 단계에서 주석 처리하는 키워드 규칙. 이것이 팩의 권장 컨트롤입니다.

MEASURE 2.6 — 콘텐츠 안전

자해 / 안전하지 않은 콘텐츠를 플래그합니다. Self-Harm Keywords 프리셋에서 빌드되며, 자해 방법을 묻는 input 단계 프롬프트를 차단합니다. 차단된 요청이 헬프라인 정보와 함께 인간 검토자에게 표면화되도록 당신 자신의 에스컬레이션 워크플로와 짝지으세요.

GOVERN 1.2 — 거버넌스 로깅

guardrail 결정을 거버넌스 증거로 기록합니다. Compliance Logger (observe-only) 프리셋에서 빌드됨 — 트래픽을 차단하거나 수정하지 않고 입력과 출력 전반에서 PII 발생과 정책 결정을 로깅합니다.

이것들은 게이트웨이가 담을 수 있는 위험 기능 의무입니다: 입력에 대한 탐지, 안전 차단, 그리고 결정 기록. 프레임워크는 또한 게이트웨이가 수행할 수 없는 조직적 작업을 요구합니다 — 당신의 GOVERN 1.1 정책과 책임 구조 — 이는 팩이 게이트웨이 밖에서 증거를 제시할 수 있도록 Organizational: true 행으로 담습니다. 책임 범위를 참조하세요.

2. 하나의 구체적 예시: 설치, 관찰, 라이브 전환

팩 작업은 릴레이 sk-orca-… 키가 아니라 당신의 콘솔 세션(UserAuth)을 사용합니다. 카탈로그 탐색과 준비 상태 확인은 모든 워크스페이스 Member에게 무료입니다; 설치는 유료 플랜의 워크스페이스 Admin 액션이며, 서버 측에서 강제되므로 직접 API 호출이 게이트를 우회할 수 없습니다.

탐색 및 준비 상태 확인 (Member, 무료)

Compliance → Frameworks를 열고 NIST AI RMF를 선택하세요. 준비 상태는 당신이 무언가에 커밋하기 전에 세 컨트롤이 현재 정책에 어떻게 매핑되는지 보여줍니다.

팩 설치 (Admin, 유료)

콘솔에서 설치하면 POST /api/compliance/packs/nist_ai_rmf/install을 발행합니다. 한 번의 호출이 컨트롤을 팩의 출처로 태그된 실제로 편집 가능한 guardrail로 구체화합니다 — 관찰 모드로 생성되므로, 차단하는 대신 플래그하고 영향을 주지 않고 라이브 트래픽에서 “차단되었을” 증거를 수집합니다.

POST /api/compliance/packs/nist_ai_rmf/install

매치 지켜보기

MANAGE와 MEASURE 컨트롤이 Guardrails 매치 피드 (GET /api/guardrail/match, Member)에서 무엇을 잡을지 검토하세요. 콘솔에서 어떤 규칙이든 튜닝하세요 — 그것은 표준 guardrail이므로, 모든 편집, 버전, 되돌리기 경로가 변경 없이 작동합니다.

라이브 전환 및 연결

증거가 맞아 보이면 guardrail을 관찰 모드에서 빼낸 다음, 키에 guardrail_id를 설정하여 에이전트가 사용하는 키에 연결하세요(또는 워크스페이스 기본값으로 만드세요). 이제 MEASURE 2.6 자해 차단이 미터링 전에 요청에서 강제됩니다.

구성 라우트에 릴레이 sk-orca-… 키를 결코 건네지 마세요. /api/compliance/*와 /api/guardrail/* 라우트는 릴레이 키가 아니라 당신의 콘솔 세션으로 인증합니다 — /v1/* 모델 호출만 sk-orca-…를 사용합니다. 설치, 라이브 전환, 보고, 레지던시 설정은 게이트된 Admin 액션입니다.

MEASURE 2.6 컨트롤의 guardrail_blocked 결과는 할당량이 들지 않는 HTTP 400입니다 — 입력 단계 차단은 미터링 전에 잡히고, skip-retry로 표시되므로, 차단된 안전하지 않은 프롬프트가 결코 지출을 태우거나 루프하지 않습니다.

3. 서명되고 검증 가능한 보고서 출하

강제하고 있을 때, 컴플라이언스 보고서를 생성하세요: CSV, JSON, 또는 PDF로 내보내 검토자에게 건넬 수 있는 Ed25519 서명, SHA-256 스탬프 아티팩트. 누구나 계정 없이 그것을 검증할 수 있습니다.

실제 카운트가 있는 기능별 커버리지

각 컨트롤 행은 그 상태 — covered, observe, gap, 또는 attested — 와 그것이 기간 동안 실제로 몇 번 발동했는지를 담습니다. 2,000건의 인젝션 시도를 플래그한 MANAGE 2.1 컨트롤은 매치가 0인 것과 검토자에게 다르게 읽히며, 보고서는 둘 다 보여줍니다.

출처 계보

모든 구체화된 컨트롤은 그 control_id(예: nistai.injection), 축어적 조항(NIST AI RMF MANAGE 2.1), 평면, 그리고 그것을 강제하는 라이브 guardrail의 id를 기록합니다 — 그래서 검토자가 기능 → 컨트롤 → 강제하는 정책 → 매치를 걷습니다, 추론된 단계 없이.

공개 검증

GET /api/public/compliance/pubkey에서 서명 공개 키를 가져오고, 보고서를 POST /api/public/compliance/verify에 제출하거나, 범위 지정된 검토자 공유 링크를 GET /api/public/compliance/share/:token에서 여세요. 계정 불필요.

전체 표지-에서-푸터 레이아웃은 서명된 보고서를, 검증 워크스루는 보고서 검증을 참조하세요.

4. NIST AI RMF 증거를 리전 스탬프

보고서는 당신의 선언된 데이터 레지던시 리전 (us / eu / uk / ap / cn / global) 하에서 스탬프되고 저장됩니다; 보고서는 일치하는 리전 하에서만 제공되며, 크로스 리전 읽기는 보류됩니다. 워크스페이스 Admin이 PUT /api/compliance/residency로 설정합니다.

레지던시는 추론이 실행되는 곳의 지리적 고정이 아니라 컴플라이언스 보고서 아티팩트의 리전입니다. 그것은 당신의 서명된 증거가 사는 곳과 누가 읽을 수 있는지를 제어하지, 모델 트래픽이 라우팅되는 곳을 제어하지 않습니다. 데이터 레지던시와 크로스 리전을 참조하세요.

요청 로그는 기본 30일 보존(180일 하드 최댓값으로 서버 클램프)으로 설정되며, 사용자 삭제는 30일 유예 기간 그다음 PII 스크럽을 실행합니다 — 검토자가 당신의 보존 자세에 대해 물을 때 둘 다 관련됩니다. 보존과 삭제권을 참조하세요.

5. 프로그램 나머지와 함께하는 NIST AI RMF

AI RMF는 좀처럼 혼자 도착하지 않습니다. 동일한 설치 흐름이 인접한 AI 거버넌스와 LLM 보안 프레임워크를 커버하며, 각각 자체 편집 가능한 컨트롤을 구체화합니다:

팩	프레임워크
`iso_42001`	ISO/IEC 42001 AI 관리 시스템
`eu_ai_act`	EU Artificial Intelligence Act
`owasp_llm`	OWASP Top 10 for LLM Applications

ISO 42001

AI 관리 시스템 증거.

EU AI Act

금지된 관행, 투명성, 기록 보관.

OWASP LLM Top 10

높은 신호의 LLM 보안 위험을 팩으로.

MANAGE 2.1 프롬프트 인젝션 컨트롤은 당신의 보안 정책이 이미 추적하는 동일한 위협에 대한 게이트웨이의 방어입니다. 컴플라이언스 팩과 독립적으로 그것을 강화하고 싶다면, guardrail 레퍼런스가 더 깊이 들어갑니다.

6. 다음으로 갈 곳

팩 설치

모든 프레임워크에 걸쳐 공유되는 전체 설치 메커니즘.

관찰 vs 강제

관찰 모드가 어떻게 의도적으로 라이브 강제로 바뀌는지.

Guardrails 레퍼런스

NIST AI RMF 팩이 빌드되는 콘텐츠 평면 컨트롤.

프롬프트 인젝션

MANAGE 2.1 컨트롤이 방어하는 위협.

관찰 모드로 설치하고, Map/Measure/Manage 컨트롤이 무엇을 잡을지 지켜보고, 에이전트의 키에서 그것들을 라이브로 가져간 다음, 서명된 보고서를 출하하세요. 그것이 프로젝트가 아니라 구성으로서의 NIST AI RMF 정렬입니다.

​1. NIST AI RMF 정렬이 게이트웨이에서 커버하는 것

​2. 하나의 구체적 예시: 설치, 관찰, 라이브 전환

​3. 서명되고 검증 가능한 보고서 출하

​4. NIST AI RMF 증거를 리전 스탬프

​5. 프로그램 나머지와 함께하는 NIST AI RMF

ISO 42001

EU AI Act

OWASP LLM Top 10

​6. 다음으로 갈 곳

팩 설치

관찰 vs 강제

Guardrails 레퍼런스

프롬프트 인젝션

1. NIST AI RMF 정렬이 게이트웨이에서 커버하는 것

2. 하나의 구체적 예시: 설치, 관찰, 라이브 전환

3. 서명되고 검증 가능한 보고서 출하

4. NIST AI RMF 증거를 리전 스탬프

5. 프로그램 나머지와 함께하는 NIST AI RMF

6. 다음으로 갈 곳