owasp_llm) — não apenas uma visão de checklist.
Instalá-lo materializa as regras de guardrail e a política de firewall para as
quais cada risco mapeia, no mesmo caminho que cada requisição a
api.orcarouter.ai já cruza, e tira snapshot do que foi capturado em um relatório
assinado que você pode entregar a um auditor.
Esta página mapeia cada risco coberto do OWASP LLM para o controle do OrcaRouter
que o aplica, mostra como instalar o pack, e leva à referência profunda de cada
controle. Para o arco de instalar-e-ir-ao-ar entre todos os frameworks, comece
pela Visão geral de compliance.
1. owasp llm top 10 mapeado para controles do OrcaRouter
O packowasp_llm é um mapeamento de controle que instala como política real —
cada entrada abaixo é um controle que o gateway aplica, não uma descrição de
intenção. Os riscos de alto sinal mapeiam para guardrails ao vivo e uma política
de firewall; um risco (LLM05) é um controle organizacional sem superfície de
enforcement no gateway.
LLM01 — Injeção de prompt
LLM01 — Injeção de prompt
Um Guardrail no input da requisição. O pack combina o preset de segurança
Prompt-Injection Basics (sinalização por keyword) com uma regra de regex de
jailbreak (modos DAN/STAN/AIM mais contrabando de texto oculto por tag-byte
Unicode) para capturar tentativas de injeção diretas e ofuscadas. Combine-o com
uma regra
llm_judge para intenção semântica de injeção. Veja
Injeção de prompt e
Jailbreaks.LLM02 — Tratamento inseguro de saída
LLM02 — Tratamento inseguro de saída
Um Guardrail no stage de output que bloqueia respostas de modelo contendo
payloads clássicos de SQL-injection (
UNION SELECT, OR 1=1, DROP TABLE)
antes que cheguem a um sistema downstream que poderia auto-executá-los. Revise
as correspondências no feed de correspondências de
Guardrails.LLM05 — Supply chain
LLM05 — Supply chain
Um controle organizacional — a garantia de supply-chain dos seus modelos,
dados e dependências é um processo que você possui, não uma verificação do
gateway em tempo de requisição. O pack o carrega como evidência no relatório
para que seu auditor o veja contabilizado. Para o lado de runtime de
ferramentas de terceiros, veja
Segurança de agentes de IA.
LLM06 — Divulgação de informação sensível
LLM06 — Divulgação de informação sensível
Dois Guardrails: o Secrets & API-Key Blocker (rejeita requisições que
carregam credenciais AWS / OpenAI / GitHub) e um PII Blocker estrito (rejeita
requisições que carregam emails, números de telefone, SSNs, cartões de crédito
ou IPs). Ambos rejeitam totalmente na requisição antes que ela chegue ao
provedor. Veja as seções de PII e segredos de
Guardrails.
LLM07 — Vazamento de system prompt
LLM07 — Vazamento de system prompt
Um Guardrail no stage de output que bloqueia respostas de modelo que ecoam
tokens de controle de chat-template (
<|system|>, <|im_start|>) — evidência
clara de que o system prompt está sendo vazado de volta. Ajuste a regra e
revise seus hits no feed de correspondências.LLM08 — Agência excessiva
LLM08 — Agência excessiva
Uma regra de política de Firewall que nega chamadas de ferramenta
perigosas da classe shell / exec — o controle do plano de ação. É aqui que o
firewall, não um guardrail de conteúdo, faz o trabalho: ele avalia as chamadas
de ferramenta que seu modelo emite. Veja
Chamadas de ferramenta perigosas e
Agência excessiva.
O pack cobre o subconjunto de alto sinal da lista OWASP que tem uma superfície
concreta de enforcement no gateway — LLM01, LLM02, LLM06, LLM07, LLM08 como
controles aplicados, mais LLM05 como evidência organizacional. Os riscos que vivem
inteiramente no código da sua própria aplicação (roubo de modelo, envenenamento de
dados de treinamento) estão fora do caminho do gateway e continuam sendo seus para
endereçar — veja
Responsabilidade compartilhada.
2. Por que guardrails e firewall, não um único controle
A lista OWASP LLM abrange dois planos diferentes, e o OrcaRouter divide seus controles ao longo da mesma linha:| Plano | Cobre | Controle |
|---|---|---|
| Conteúdo | LLM01, LLM02, LLM06, LLM07 | Guardrails |
| Ação | LLM08 | Firewall |
3. Instale o pack
Navegar pelo catálogo e pela prontidão é gratuito para qualquer Member do workspace. Instalar o pack materializa os guardrails e a política de firewall, e é uma ação de Admin do workspace gated a um plano pago. Faça-o a partir do console — Compliance → Catalog → OWASP LLM Top-10 → Install. A instalação cria regras de guardrail e uma política de firewall reais e editáveis no seu workspace. Elas são suas para ajustar depois — ajuste a lista de entidades de PII, troque o deny do LLM08 por um vereditoaudit enquanto você
aprende o comportamento dos seus agentes, ou adicione uma regra de injeção
llm_judge por cima da base de keyword/regex do LLM01. Vincule o guardrail a uma
chave via guardrail_id e a política de firewall via firewall_policy_id, ou
defina qualquer uma como padrão do workspace.
4. Prove com um relatório assinado
Cobertura que você não pode mostrar não é cobertura. Depois que o pack roda, gere um relatório de compliance — ele é assinado com Ed25519 e carimbado com SHA256, exportável como CSV / JSON / PDF, e verificável publicamente sem uma conta OrcaRouter.Gere um relatório assinado
O que o relatório tira como snapshot e como ele é assinado.
Verifique um relatório
Entregue a um auditor o endpoint público de verify — nenhuma conta necessária.
5. Para onde ir a seguir
Visão geral de compliance
O arco completo de instalar → aplicar → relatar → ir ao ar.
O que há em um pack
Como os controles de um pack se tornam guardrails e política de firewall.
Todos os frameworks
Os outros packs de IA, segurança e privacidade no catálogo.
Segurança de agentes de IA
A linha de base que endurece os agentes contra esses riscos de ponta a ponta.
