1. O que o alinhamento ao nist ai rmf cobre no gateway
O packnist_ai_rmf (NIST AI Risk Management Framework 1.0, jurisdição US)
mapeia três funções do framework para guardrails do plano de conteúdo. Cada um
é uma regra real e editável construída a partir da mesma biblioteca de presets
contra a qual você pode autorar à mão — abra-a, leia-a, ajuste-a como qualquer
outro guardrail.
MANAGE 2.1 — Defesa contra injeção de prompt
MANAGE 2.1 — Defesa contra injeção de prompt
Detecta e sinaliza tentativas de injeção de prompt na requisição. Construída a
partir do preset Prompt-Injection Basics — uma regra de keyword que anota
frases comuns de jailbreak (
ignore previous instructions,
reveal your system prompt) no stage de input para revisão, sem bloquear o
usuário. Este é o controle recomendado do pack.MEASURE 2.6 — Segurança de conteúdo
MEASURE 2.6 — Segurança de conteúdo
Sinaliza conteúdo de automutilação / inseguro. Construída a partir do preset
Self-Harm Keywords, que bloqueia prompts no stage de input perguntando
como se automutilar. Combine-a com seu próprio fluxo de escalonamento para que
uma requisição bloqueada chegue a um revisor humano com informação de linha de
apoio.
GOVERN 1.2 — Logging de governança
GOVERN 1.2 — Logging de governança
Registra decisões de guardrail como evidência de governança. Construído a
partir do preset Compliance Logger (observe-only) — ele registra
ocorrências de PII e decisões de política em input e output sem bloquear ou
modificar o tráfego.
Estas são as obrigações de função de risco que o gateway pode carregar:
detecção em inputs, um block de segurança e um registro de decisões. O framework
também pede trabalho organizacional que o gateway não pode realizar — suas
políticas GOVERN 1.1 e estrutura de accountability — que o pack carrega como uma
linha
Organizational: true para você evidenciar fora do gateway. Veja
responsabilidade compartilhada.2. Um exemplo concreto: instalar, observar, ir ao ar
O trabalho com packs usa a sua sessão de console (UserAuth) — não uma chave de relaysk-orca-…. Navegar pelo catálogo e verificar a prontidão são gratuitos
para qualquer Member do workspace; instalar é uma ação de Admin do
workspace em um plano pago, aplicada no servidor para que uma chamada direta
de API não possa contornar o gate.
Navegue e verifique a prontidão (Member, gratuito)
Abra Compliance → Frameworks e selecione NIST AI RMF. A prontidão
mostra como os três controles mapeiam para suas políticas atuais antes de você
se comprometer com qualquer coisa.
Instale o pack (Admin, pago)
Instalar a partir do console emite
POST /api/compliance/packs/nist_ai_rmf/install. Uma chamada materializa os
controles em um guardrail real e editável marcado com a proveniência do pack —
criado em observe mode, de modo que ele sinaliza em vez de bloquear e você
coleta evidência de “would-have-blocked” no tráfego ao vivo sem afetá-lo.Observe as correspondências
Revise o que os controles MANAGE e MEASURE capturariam no feed de
correspondências de Guardrails (
GET /api/guardrail/match, Member).
Ajuste qualquer regra no console — é um guardrail padrão, então cada caminho de
edição, versão e reversão funciona sem alteração.3. Entregue um relatório assinado e verificável
Quando você está aplicando, gere o relatório de compliance: um artefato assinado com Ed25519 e carimbado com SHA-256 que você pode exportar como CSV, JSON ou PDF e entregar a um revisor. Qualquer pessoa pode verificá-lo sem uma conta.Cobertura por função com contagens reais
Cobertura por função com contagens reais
Cada linha de controle carrega seu status —
covered, observe, gap ou
attested — e quantas vezes ela de fato disparou sobre o período. Um controle
MANAGE 2.1 que sinalizou 2.000 tentativas de injeção lê diferente para um
revisor do que um com zero correspondências, e o relatório mostra ambos.Linhagem de proveniência
Linhagem de proveniência
Cada controle materializado registra seu
control_id (ex.:
nistai.injection), a cláusula literal (NIST AI RMF MANAGE 2.1), o plano e o
id do guardrail ao vivo que o aplica — de modo que um revisor percorre função →
controle → política que a aplica → correspondências sem nenhum passo inferido.Verificação pública
Verificação pública
Busque a chave pública de assinatura em
GET /api/public/compliance/pubkey,
submeta o relatório a POST /api/public/compliance/verify, ou abra um link de
compartilhamento com escopo para o revisor em
GET /api/public/compliance/share/:token. Nenhuma conta necessária.4. Carimbe por região sua evidência NIST AI RMF
Os relatórios são carimbados e armazenados sob a sua região de residência de dados declarada (us / eu / uk / ap / cn / global); um relatório só é
servido sob uma região correspondente, e as leituras cross-region são retidas. Um
Admin do workspace a define via PUT /api/compliance/residency.
Os logs de requisição têm padrão de retenção de 30 dias (server-clamped a um máx
rígido de 180 dias), e uma exclusão de usuário roda uma janela de carência de 30
dias e depois um scrub de PII — ambos relevantes quando um revisor pergunta sobre
sua postura de retenção. Veja Retenção e
Direito ao apagamento.
5. O NIST AI RMF ao lado do resto do seu programa
O AI RMF raramente vem sozinho. O mesmo fluxo de instalação cobre os frameworks adjacentes de governança de IA e segurança de LLM, cada um materializando seus próprios controles editáveis:| Pack | Framework |
|---|---|
iso_42001 | ISO/IEC 42001 sistema de gestão de IA |
eu_ai_act | EU Artificial Intelligence Act |
owasp_llm | OWASP Top 10 for LLM Applications |
ISO 42001
Evidência de sistema de gestão de IA.
EU AI Act
Prática proibida, transparência, registro de atividades.
OWASP LLM Top 10
Os riscos de segurança de LLM de alto sinal como um pack.
6. Para onde ir a seguir
Instale um pack
A mecânica completa de instalação, compartilhada entre todos os frameworks.
Observe vs enforce
Como o observe mode se transforma em enforcement ao vivo, deliberadamente.
Referência de Guardrails
Os controles do plano de conteúdo a partir dos quais o pack NIST AI RMF é
construído.
Injeção de prompt
A ameaça contra a qual o controle MANAGE 2.1 defende.
