Alinhamento ao NIST AI RMF para agentes de IA

Você está alinhando um agente de IA ao NIST AI Risk Management Framework e seu revisor quer ver as funções Govern / Map / Measure / Manage respaldadas por algo que de fato roda — não uma planilha de intenções. O pack NIST AI RMF mapeia as funções de risco do framework para guardrails reais do gateway, materializa-as no seu workspace em uma chamada, e deixa você rodá-las em observe mode antes de qualquer coisa aplicar. Esta página é o ponto de partida específico do NIST AI RMF sobre o fluxo de compliance compartilhado. Para a mecânica que todo pack tem em comum — observe-first, plan gating, o relatório assinado — comece pela visão geral de compliance.

1. O que o alinhamento ao nist ai rmf cobre no gateway

O pack nist_ai_rmf (NIST AI Risk Management Framework 1.0, jurisdição US) mapeia três funções do framework para guardrails do plano de conteúdo. Cada um é uma regra real e editável construída a partir da mesma biblioteca de presets contra a qual você pode autorar à mão — abra-a, leia-a, ajuste-a como qualquer outro guardrail.

MANAGE 2.1 — Defesa contra injeção de prompt

Detecta e sinaliza tentativas de injeção de prompt na requisição. Construída a partir do preset Prompt-Injection Basics — uma regra de keyword que anota frases comuns de jailbreak (ignore previous instructions, reveal your system prompt) no stage de input para revisão, sem bloquear o usuário. Este é o controle recomendado do pack.

MEASURE 2.6 — Segurança de conteúdo

Sinaliza conteúdo de automutilação / inseguro. Construída a partir do preset Self-Harm Keywords, que bloqueia prompts no stage de input perguntando como se automutilar. Combine-a com seu próprio fluxo de escalonamento para que uma requisição bloqueada chegue a um revisor humano com informação de linha de apoio.

GOVERN 1.2 — Logging de governança

Registra decisões de guardrail como evidência de governança. Construído a partir do preset Compliance Logger (observe-only) — ele registra ocorrências de PII e decisões de política em input e output sem bloquear ou modificar o tráfego.

Estas são as obrigações de função de risco que o gateway pode carregar: detecção em inputs, um block de segurança e um registro de decisões. O framework também pede trabalho organizacional que o gateway não pode realizar — suas políticas GOVERN 1.1 e estrutura de accountability — que o pack carrega como uma linha Organizational: true para você evidenciar fora do gateway. Veja responsabilidade compartilhada.

2. Um exemplo concreto: instalar, observar, ir ao ar

O trabalho com packs usa a sua sessão de console (UserAuth) — não uma chave de relay sk-orca-…. Navegar pelo catálogo e verificar a prontidão são gratuitos para qualquer Member do workspace; instalar é uma ação de Admin do workspace em um plano pago, aplicada no servidor para que uma chamada direta de API não possa contornar o gate.

Navegue e verifique a prontidão (Member, gratuito)

Abra Compliance → Frameworks e selecione NIST AI RMF. A prontidão mostra como os três controles mapeiam para suas políticas atuais antes de você se comprometer com qualquer coisa.

Instale o pack (Admin, pago)

Instalar a partir do console emite POST /api/compliance/packs/nist_ai_rmf/install. Uma chamada materializa os controles em um guardrail real e editável marcado com a proveniência do pack — criado em observe mode, de modo que ele sinaliza em vez de bloquear e você coleta evidência de “would-have-blocked” no tráfego ao vivo sem afetá-lo.

POST /api/compliance/packs/nist_ai_rmf/install

Observe as correspondências

Revise o que os controles MANAGE e MEASURE capturariam no feed de correspondências de Guardrails (GET /api/guardrail/match, Member). Ajuste qualquer regra no console — é um guardrail padrão, então cada caminho de edição, versão e reversão funciona sem alteração.

Leve ao ar e vincule

Vire o guardrail para fora do observe mode quando a evidência parecer certa, depois vincule-o às chaves que seus agentes usam definindo guardrail_id na chave (ou faça dele o padrão do workspace). Agora o block de automutilação MEASURE 2.6 aplica na requisição antes da medição.

Nunca entregue uma chave de relay sk-orca-… a uma rota de configuração. As rotas /api/compliance/* e /api/guardrail/* autenticam com a sua sessão de console, não com a chave de relay — apenas as chamadas de modelo /v1/* usam sk-orca-…. Instalar, ir ao ar, relatar e definir a residência são as ações gated de Admin.

Um resultado guardrail_blocked do controle MEASURE 2.6 é um HTTP 400 que não custa cota — um block de stage de input é capturado pré-medição, e é marcado skip-retry, de modo que um prompt inseguro bloqueado nunca queima gasto nem entra em loop.

3. Entregue um relatório assinado e verificável

Quando você está aplicando, gere o relatório de compliance: um artefato assinado com Ed25519 e carimbado com SHA-256 que você pode exportar como CSV, JSON ou PDF e entregar a um revisor. Qualquer pessoa pode verificá-lo sem uma conta.

Cobertura por função com contagens reais

Cada linha de controle carrega seu status — covered, observe, gap ou attested — e quantas vezes ela de fato disparou sobre o período. Um controle MANAGE 2.1 que sinalizou 2.000 tentativas de injeção lê diferente para um revisor do que um com zero correspondências, e o relatório mostra ambos.

Linhagem de proveniência

Cada controle materializado registra seu control_id (ex.: nistai.injection), a cláusula literal (NIST AI RMF MANAGE 2.1), o plano e o id do guardrail ao vivo que o aplica — de modo que um revisor percorre função → controle → política que a aplica → correspondências sem nenhum passo inferido.

Verificação pública

Busque a chave pública de assinatura em GET /api/public/compliance/pubkey, submeta o relatório a POST /api/public/compliance/verify, ou abra um link de compartilhamento com escopo para o revisor em GET /api/public/compliance/share/:token. Nenhuma conta necessária.

Veja o relatório assinado para o layout completo de capa a rodapé e Verifique um relatório para o passo a passo de verificação.

4. Carimbe por região sua evidência NIST AI RMF

Os relatórios são carimbados e armazenados sob a sua região de residência de dados declarada (us / eu / uk / ap / cn / global); um relatório só é servido sob uma região correspondente, e as leituras cross-region são retidas. Um Admin do workspace a define via PUT /api/compliance/residency.

A residência é a região do artefato de relatório de compliance, não a geo-fixação de onde a inferência roda. Ela controla onde sua evidência assinada reside e quem pode lê-la, não para onde o tráfego de modelo é roteado. Veja residência de dados e cross-region.

Os logs de requisição têm padrão de retenção de 30 dias (server-clamped a um máx rígido de 180 dias), e uma exclusão de usuário roda uma janela de carência de 30 dias e depois um scrub de PII — ambos relevantes quando um revisor pergunta sobre sua postura de retenção. Veja Retenção e Direito ao apagamento.

5. O NIST AI RMF ao lado do resto do seu programa

O AI RMF raramente vem sozinho. O mesmo fluxo de instalação cobre os frameworks adjacentes de governança de IA e segurança de LLM, cada um materializando seus próprios controles editáveis:

Pack	Framework
`iso_42001`	ISO/IEC 42001 sistema de gestão de IA
`eu_ai_act`	EU Artificial Intelligence Act
`owasp_llm`	OWASP Top 10 for LLM Applications

ISO 42001

Evidência de sistema de gestão de IA.

EU AI Act

Prática proibida, transparência, registro de atividades.

OWASP LLM Top 10

Os riscos de segurança de LLM de alto sinal como um pack.

O controle de injeção de prompt MANAGE 2.1 é a defesa do gateway contra a mesma ameaça que suas políticas de segurança já rastreiam. Se você quer endurecê-lo independentemente do compliance pack, a referência de guardrail vai mais fundo.

6. Para onde ir a seguir

Instale um pack

A mecânica completa de instalação, compartilhada entre todos os frameworks.

Observe vs enforce

Como o observe mode se transforma em enforcement ao vivo, deliberadamente.

Referência de Guardrails

Os controles do plano de conteúdo a partir dos quais o pack NIST AI RMF é construído.

Injeção de prompt

A ameaça contra a qual o controle MANAGE 2.1 defende.

Instale em observe mode, observe o que os controles Map/Measure/Manage capturariam, leve-os ao ar nas chaves dos seus agentes, depois entregue um relatório assinado. Isso é alinhamento ao nist ai rmf como uma configuração, não um projeto.

​1. O que o alinhamento ao nist ai rmf cobre no gateway

​2. Um exemplo concreto: instalar, observar, ir ao ar

​3. Entregue um relatório assinado e verificável

​4. Carimbe por região sua evidência NIST AI RMF

​5. O NIST AI RMF ao lado do resto do seu programa

ISO 42001

EU AI Act

OWASP LLM Top 10

​6. Para onde ir a seguir

Instale um pack

Observe vs enforce

Referência de Guardrails

Injeção de prompt

1. O que o alinhamento ao nist ai rmf cobre no gateway

2. Um exemplo concreto: instalar, observar, ir ao ar

3. Entregue um relatório assinado e verificável

4. Carimbe por região sua evidência NIST AI RMF

5. O NIST AI RMF ao lado do resto do seu programa

6. Para onde ir a seguir