1. Cosa copre l’allineamento al nist ai rmf sul gateway
Il packnist_ai_rmf (NIST AI Risk Management Framework 1.0, giurisdizione
US) mappa tre funzioni del framework su guardrail del piano dei
contenuti. Ciascuno è una regola reale e modificabile costruita dalla stessa
libreria di preset contro cui puoi autorare a mano — aprila, leggila,
regolala come qualsiasi altro guardrail.
MANAGE 2.1 — Difesa da prompt injection
MANAGE 2.1 — Difesa da prompt injection
Rileva e segnala i tentativi di prompt injection sulla richiesta.
Costruito dal preset Prompt-Injection Basics — una regola a keyword
che annota le frasi comuni di jailbreak (
ignore previous instructions,
reveal your system prompt) in fase di input per la revisione, senza
bloccare l’utente. Questo è il controllo consigliato del pack.MEASURE 2.6 — Sicurezza dei contenuti
MEASURE 2.6 — Sicurezza dei contenuti
Segnala contenuti di autolesionismo / non sicuri. Costruito dal preset
Self-Harm Keywords, che blocca i prompt in fase di input che chiedono
come autolesionarsi. Abbinalo al tuo workflow di escalation così una
richiesta bloccata emerge a un revisore umano con informazioni sui numeri
di assistenza.
GOVERN 1.2 — Logging di governance
GOVERN 1.2 — Logging di governance
Registra le decisioni del guardrail come evidenza di governance. Costruito
dal preset Compliance Logger (observe-only) — logga le occorrenze di
PII e le decisioni di policy attraverso input e output senza bloccare o
modificare il traffico.
Questi sono gli obblighi delle funzioni di rischio che il gateway può
portare: detection sugli input, un block di sicurezza, e un record delle
decisioni. Il framework chiede anche un lavoro organizzativo che il gateway
non può svolgere — le tue policy GOVERN 1.1 e la struttura di accountability —
che il pack porta come una riga
Organizational: true da evidenziare fuori
dal gateway. Vedi
responsabilità condivisa.2. Un esempio concreto: installa, osserva, vai live
Il lavoro sui pack usa la tua sessione di console (UserAuth) — non una chiave di relaysk-orca-…. Sfogliare il catalogo e controllare la readiness
sono gratis per qualsiasi Member del workspace; installare è
un’azione da Admin del workspace su un piano a pagamento, applicata
lato server così una chiamata API diretta non può aggirare il gate.
Sfoglia e controlla la readiness (Member, gratis)
Apri Compliance → Frameworks e seleziona NIST AI RMF. La readiness
mostra come i tre controlli mappano sulle tue policy correnti prima di
impegnarti in qualcosa.
Installa il pack (Admin, a pagamento)
Installare dalla console emette
POST /api/compliance/packs/nist_ai_rmf/install. Una sola chiamata
materializza i controlli in un guardrail reale e modificabile taggato con
la provenienza del pack — creato in observe mode, così segnala anziché
bloccare e raccogli evidenze “avrebbe-bloccato” sul traffico live senza
influenzarlo.Osserva i match
Passa in rassegna cosa intercetterebbero i controlli MANAGE e MEASURE nel
feed di match dei Guardrails (
GET /api/guardrail/match, Member).
Regola qualsiasi regola nella console — è un guardrail standard, quindi
ogni percorso di modifica, versione e revert funziona invariato.Portalo live e collegalo
Tira il guardrail fuori dall’observe mode quando le evidenze sembrano
giuste, poi collegalo alle chiavi usate dai tuoi agent impostando
guardrail_id sulla chiave (o rendilo il default del workspace). Ora il
block di autolesionismo MEASURE 2.6 applica sulla richiesta prima del
metering.3. Spedisci un report firmato e verificabile
Quando applichi, genera il report di compliance: un artefatto firmato Ed25519 e marcato SHA-256 che puoi esportare come CSV, JSON o PDF e consegnare a un revisore. Chiunque può verificarlo senza un account.Copertura per-funzione con conteggi reali
Copertura per-funzione con conteggi reali
Ogni riga di controllo porta il suo status —
covered, observe, gap
o attested — e quante volte si è effettivamente attivata sul periodo. Un
controllo MANAGE 2.1 che ha segnalato 2.000 tentativi di injection si
legge diversamente per un revisore rispetto a uno con zero match, e il
report mostra entrambi.Tracciabilità di provenienza
Tracciabilità di provenienza
Ogni controllo materializzato registra il suo
control_id (es.
nistai.injection), la clausola verbatim (NIST AI RMF MANAGE 2.1), il
piano, e l’id del guardrail live che la applica — così un revisore
percorre funzione → controllo → policy applicante → match senza alcun
passo inferito.Verifica pubblica
Verifica pubblica
Recupera la chiave pubblica di firma su
GET /api/public/compliance/pubkey, invia il report a
POST /api/public/compliance/verify, o apri un link di condivisione per
revisore con scope su GET /api/public/compliance/share/:token. Nessun
account richiesto.4. Region-stamp delle tue evidenze NIST AI RMF
I report sono marcati e archiviati sotto la tua regione di data-residency dichiarata (us / eu / uk / ap / cn / global); un report viene
servito solo sotto una regione corrispondente, e le letture cross-region
vengono trattenute. Un Admin del workspace la imposta tramite
PUT /api/compliance/residency.
I log delle richieste hanno default di retention di 30 giorni (server-clamped
a un massimo massimo di 180 giorni), e una cancellazione utente esegue una
finestra di grazia di 30 giorni poi uno scrub PII — entrambi rilevanti quando
un revisore chiede della tua postura di retention. Vedi
Retention e
Diritto alla cancellazione.
5. Il NIST AI RMF accanto al resto del tuo programma
L’AI RMF atterra raramente da solo. Lo stesso flusso di installazione copre i framework adiacenti di governance dell’AI e di sicurezza LLM, ciascuno materializzando i propri controlli modificabili:| Pack | Framework |
|---|---|
iso_42001 | ISO/IEC 42001 sistema di gestione dell’AI |
eu_ai_act | EU Artificial Intelligence Act |
owasp_llm | OWASP Top 10 for LLM Applications |
ISO 42001
Evidenze del sistema di gestione dell’AI.
EU AI Act
Pratiche proibite, trasparenza, record-keeping.
OWASP LLM Top 10
I rischi di sicurezza LLM ad alto segnale come pack.
6. Dove andare dopo
Installa un pack
L’intera meccanica di installazione, condivisa tra ogni framework.
Observe vs enforce
Come l’observe mode si trasforma in applicazione live, deliberatamente.
Riferimento Guardrails
I controlli del piano dei contenuti da cui è costruito il pack NIST AI
RMF.
Prompt injection
La minaccia da cui il controllo MANAGE 2.1 difende.
