1. NIST AI RMF 정렬이 게이트웨이에서 커버하는 것
nist_ai_rmf 팩(NIST AI Risk Management Framework 1.0, 관할권 US)은 세
프레임워크 기능을 콘텐츠 평면 guardrail에 매핑합니다. 각각은 당신이
손으로 작성할 수 있는 동일한 프리셋 라이브러리에서 빌드된 실제로 편집
가능한 규칙입니다 — 다른 어떤 guardrail처럼 그것을 열고, 읽고, 튜닝하세요.
MANAGE 2.1 — 프롬프트 인젝션 방어
MANAGE 2.1 — 프롬프트 인젝션 방어
요청에서 프롬프트 인젝션 시도를 탐지하고 플래그합니다.
Prompt-Injection Basics 프리셋에서 빌드됨 — 일반적인 탈옥
문구(
ignore previous instructions, reveal your system prompt)를
사용자를 차단하지 않고 검토를 위해 input 단계에서 주석 처리하는 키워드
규칙. 이것이 팩의 권장 컨트롤입니다.MEASURE 2.6 — 콘텐츠 안전
MEASURE 2.6 — 콘텐츠 안전
자해 / 안전하지 않은 콘텐츠를 플래그합니다. Self-Harm Keywords
프리셋에서 빌드되며, 자해 방법을 묻는 input 단계 프롬프트를 차단합니다.
차단된 요청이 헬프라인 정보와 함께 인간 검토자에게 표면화되도록 당신
자신의 에스컬레이션 워크플로와 짝지으세요.
GOVERN 1.2 — 거버넌스 로깅
GOVERN 1.2 — 거버넌스 로깅
guardrail 결정을 거버넌스 증거로 기록합니다. Compliance Logger
(observe-only) 프리셋에서 빌드됨 — 트래픽을 차단하거나 수정하지 않고
입력과 출력 전반에서 PII 발생과 정책 결정을 로깅합니다.
이것들은 게이트웨이가 담을 수 있는 위험 기능 의무입니다: 입력에 대한
탐지, 안전 차단, 그리고 결정 기록. 프레임워크는 또한 게이트웨이가 수행할 수
없는 조직적 작업을 요구합니다 — 당신의 GOVERN 1.1 정책과 책임 구조 — 이는
팩이 게이트웨이 밖에서 증거를 제시할 수 있도록
Organizational: true 행으로
담습니다.
책임 범위를 참조하세요.2. 하나의 구체적 예시: 설치, 관찰, 라이브 전환
팩 작업은 릴레이sk-orca-… 키가 아니라 당신의 콘솔 세션(UserAuth)을
사용합니다. 카탈로그 탐색과 준비 상태 확인은 모든 워크스페이스 Member에게
무료입니다; 설치는 유료 플랜의 워크스페이스 Admin 액션이며,
서버 측에서 강제되므로 직접 API 호출이 게이트를 우회할 수 없습니다.
탐색 및 준비 상태 확인 (Member, 무료)
Compliance → Frameworks를 열고 NIST AI RMF를 선택하세요. 준비
상태는 당신이 무언가에 커밋하기 전에 세 컨트롤이 현재 정책에 어떻게
매핑되는지 보여줍니다.
팩 설치 (Admin, 유료)
콘솔에서 설치하면
POST /api/compliance/packs/nist_ai_rmf/install을 발행합니다. 한 번의
호출이 컨트롤을 팩의 출처로 태그된 실제로 편집 가능한 guardrail로
구체화합니다 — 관찰 모드로 생성되므로, 차단하는 대신 플래그하고
영향을 주지 않고 라이브 트래픽에서 “차단되었을” 증거를 수집합니다.매치 지켜보기
MANAGE와 MEASURE 컨트롤이 Guardrails 매치 피드
(
GET /api/guardrail/match, Member)에서 무엇을 잡을지 검토하세요.
콘솔에서 어떤 규칙이든 튜닝하세요 — 그것은 표준 guardrail이므로, 모든
편집, 버전, 되돌리기 경로가 변경 없이 작동합니다.3. 서명되고 검증 가능한 보고서 출하
강제하고 있을 때, 컴플라이언스 보고서를 생성하세요: CSV, JSON, 또는 PDF로 내보내 검토자에게 건넬 수 있는 Ed25519 서명, SHA-256 스탬프 아티팩트. 누구나 계정 없이 그것을 검증할 수 있습니다.실제 카운트가 있는 기능별 커버리지
실제 카운트가 있는 기능별 커버리지
각 컨트롤 행은 그 상태 —
covered, observe, gap, 또는
attested — 와 그것이 기간 동안 실제로 몇 번 발동했는지를 담습니다.
2,000건의 인젝션 시도를 플래그한 MANAGE 2.1 컨트롤은 매치가 0인 것과
검토자에게 다르게 읽히며, 보고서는 둘 다 보여줍니다.출처 계보
출처 계보
모든 구체화된 컨트롤은 그
control_id(예: nistai.injection), 축어적
조항(NIST AI RMF MANAGE 2.1), 평면, 그리고 그것을 강제하는 라이브
guardrail의 id를 기록합니다 — 그래서 검토자가 기능 → 컨트롤 →
강제하는 정책 → 매치를 걷습니다, 추론된 단계 없이.공개 검증
공개 검증
4. NIST AI RMF 증거를 리전 스탬프
보고서는 당신의 선언된 데이터 레지던시 리전 (us / eu / uk / ap / cn / global) 하에서 스탬프되고
저장됩니다; 보고서는 일치하는 리전 하에서만 제공되며, 크로스 리전 읽기는
보류됩니다. 워크스페이스 Admin이 PUT /api/compliance/residency로
설정합니다.
요청 로그는 기본 30일 보존(180일 하드 최댓값으로 서버 클램프)으로
설정되며, 사용자 삭제는 30일 유예 기간 그다음 PII 스크럽을 실행합니다 —
검토자가 당신의 보존 자세에 대해 물을 때 둘 다 관련됩니다.
보존과
삭제권을 참조하세요.
5. 프로그램 나머지와 함께하는 NIST AI RMF
AI RMF는 좀처럼 혼자 도착하지 않습니다. 동일한 설치 흐름이 인접한 AI 거버넌스와 LLM 보안 프레임워크를 커버하며, 각각 자체 편집 가능한 컨트롤을 구체화합니다:| 팩 | 프레임워크 |
|---|---|
iso_42001 | ISO/IEC 42001 AI 관리 시스템 |
eu_ai_act | EU Artificial Intelligence Act |
owasp_llm | OWASP Top 10 for LLM Applications |
ISO 42001
AI 관리 시스템 증거.
EU AI Act
금지된 관행, 투명성, 기록 보관.
OWASP LLM Top 10
높은 신호의 LLM 보안 위험을 팩으로.
6. 다음으로 갈 곳
팩 설치
모든 프레임워크에 걸쳐 공유되는 전체 설치 메커니즘.
관찰 vs 강제
관찰 모드가 어떻게 의도적으로 라이브 강제로 바뀌는지.
Guardrails 레퍼런스
NIST AI RMF 팩이 빌드되는 콘텐츠 평면 컨트롤.
프롬프트 인젝션
MANAGE 2.1 컨트롤이 방어하는 위협.
