Saltar para o conteúdo principal
Se sua equipe de segurança pergunta “como isto se sustenta contra o OWASP LLM Top 10?”, você quer uma resposta que aponte para controles em funcionamento, não para um slide. O OrcaRouter entrega o OWASP Top 10 for LLM Applications como um compliance pack instalável real (owasp_llm) — não apenas uma visão de checklist. Instalá-lo materializa as regras de guardrail e a política de firewall para as quais cada risco mapeia, no mesmo caminho que cada requisição a api.orcarouter.ai já cruza, e tira snapshot do que foi capturado em um relatório assinado que você pode entregar a um auditor. Esta página mapeia cada risco coberto do OWASP LLM para o controle do OrcaRouter que o aplica, mostra como instalar o pack, e leva à referência profunda de cada controle. Para o arco de instalar-e-ir-ao-ar entre todos os frameworks, comece pela Visão geral de compliance.

1. owasp llm top 10 mapeado para controles do OrcaRouter

O pack owasp_llm é um mapeamento de controle que instala como política real — cada entrada abaixo é um controle que o gateway aplica, não uma descrição de intenção. Os riscos de alto sinal mapeiam para guardrails ao vivo e uma política de firewall; um risco (LLM05) é um controle organizacional sem superfície de enforcement no gateway.
Um Guardrail no input da requisição. O pack combina o preset de segurança Prompt-Injection Basics (sinalização por keyword) com uma regra de regex de jailbreak (modos DAN/STAN/AIM mais contrabando de texto oculto por tag-byte Unicode) para capturar tentativas de injeção diretas e ofuscadas. Combine-o com uma regra llm_judge para intenção semântica de injeção. Veja Injeção de prompt e Jailbreaks.
Um Guardrail no stage de output que bloqueia respostas de modelo contendo payloads clássicos de SQL-injection (UNION SELECT, OR 1=1, DROP TABLE) antes que cheguem a um sistema downstream que poderia auto-executá-los. Revise as correspondências no feed de correspondências de Guardrails.
Um controle organizacional — a garantia de supply-chain dos seus modelos, dados e dependências é um processo que você possui, não uma verificação do gateway em tempo de requisição. O pack o carrega como evidência no relatório para que seu auditor o veja contabilizado. Para o lado de runtime de ferramentas de terceiros, veja Segurança de agentes de IA.
Dois Guardrails: o Secrets & API-Key Blocker (rejeita requisições que carregam credenciais AWS / OpenAI / GitHub) e um PII Blocker estrito (rejeita requisições que carregam emails, números de telefone, SSNs, cartões de crédito ou IPs). Ambos rejeitam totalmente na requisição antes que ela chegue ao provedor. Veja as seções de PII e segredos de Guardrails.
Um Guardrail no stage de output que bloqueia respostas de modelo que ecoam tokens de controle de chat-template (<|system|>, <|im_start|>) — evidência clara de que o system prompt está sendo vazado de volta. Ajuste a regra e revise seus hits no feed de correspondências.
Uma regra de política de Firewall que nega chamadas de ferramenta perigosas da classe shell / exec — o controle do plano de ação. É aqui que o firewall, não um guardrail de conteúdo, faz o trabalho: ele avalia as chamadas de ferramenta que seu modelo emite. Veja Chamadas de ferramenta perigosas e Agência excessiva.
O pack cobre o subconjunto de alto sinal da lista OWASP que tem uma superfície concreta de enforcement no gateway — LLM01, LLM02, LLM06, LLM07, LLM08 como controles aplicados, mais LLM05 como evidência organizacional. Os riscos que vivem inteiramente no código da sua própria aplicação (roubo de modelo, envenenamento de dados de treinamento) estão fora do caminho do gateway e continuam sendo seus para endereçar — veja Responsabilidade compartilhada.

2. Por que guardrails e firewall, não um único controle

A lista OWASP LLM abrange dois planos diferentes, e o OrcaRouter divide seus controles ao longo da mesma linha:
PlanoCobreControle
ConteúdoLLM01, LLM02, LLM06, LLM07Guardrails
AçãoLLM08Firewall
Os guardrails filtram o texto de prompt e resposta; o firewall avalia chamadas de ferramenta e ações outbound. A agência excessiva (LLM08) é um problema de ação, então ela mapeia para uma regra de firewall — não um filtro de conteúdo. A divisão é o ponto inteiro: leia Guardrails vs Firewall para por que um único controle não pode cobrir ambos.

3. Instale o pack

Navegar pelo catálogo e pela prontidão é gratuito para qualquer Member do workspace. Instalar o pack materializa os guardrails e a política de firewall, e é uma ação de Admin do workspace gated a um plano pago. Faça-o a partir do console — Compliance → Catalog → OWASP LLM Top-10 → Install.
Instale em um workspace não-produtivo primeiro, ou vincule a política de firewall materializada em shadow_mode para que os vereditos aplicadores registrem como [shadow] would … em vez de negar. Observe os eventos de firewall e o feed de correspondências de guardrail por uma semana, depois promova para enforcing quando as correspondências parecerem certas.
A instalação cria regras de guardrail e uma política de firewall reais e editáveis no seu workspace. Elas são suas para ajustar depois — ajuste a lista de entidades de PII, troque o deny do LLM08 por um veredito audit enquanto você aprende o comportamento dos seus agentes, ou adicione uma regra de injeção llm_judge por cima da base de keyword/regex do LLM01. Vincule o guardrail a uma chave via guardrail_id e a política de firewall via firewall_policy_id, ou defina qualquer uma como padrão do workspace.

4. Prove com um relatório assinado

Cobertura que você não pode mostrar não é cobertura. Depois que o pack roda, gere um relatório de compliance — ele é assinado com Ed25519 e carimbado com SHA256, exportável como CSV / JSON / PDF, e verificável publicamente sem uma conta OrcaRouter.

Gere um relatório assinado

O que o relatório tira como snapshot e como ele é assinado.

Verifique um relatório

Entregue a um auditor o endpoint público de verify — nenhuma conta necessária.
O relatório lista cada controle OWASP LLM, a regra que o respalda e as correspondências que ele capturou na janela de relatório — de modo que a resposta a “como isto se sustenta contra o owasp llm top 10?” é um artefato assinado, não uma garantia verbal.

5. Para onde ir a seguir

Visão geral de compliance

O arco completo de instalar → aplicar → relatar → ir ao ar.

O que há em um pack

Como os controles de um pack se tornam guardrails e política de firewall.

Todos os frameworks

Os outros packs de IA, segurança e privacidade no catálogo.

Segurança de agentes de IA

A linha de base que endurece os agentes contra esses riscos de ponta a ponta.
A cobertura do OWASP LLM no OrcaRouter é política em funcionamento, não um checklist: uma instalação conecta os guardrails e as regras de firewall para os quais cada risco mapeia, e um relatório prova que eles dispararam.