owasp_llm) — no solo una vista de lista
de verificación. Instalarlo materializa las reglas de guardrail y la política de
firewall a las que se mapea cada riesgo, en la misma ruta que cada solicitud a
api.orcarouter.ai ya cruza, y captura lo que se atrapó en un reporte firmado que
puedes entregar a un auditor.
Esta página mapea cada riesgo OWASP LLM cubierto al control de OrcaRouter que lo
aplica, muestra cómo instalar el pack, y enlaza a la referencia profunda de cada
control. Para el arco de instalar-y-poner-en-marcha en todos los frameworks,
empieza en la Visión general de cumplimiento.
1. owasp llm top 10 mapeado a controles de OrcaRouter
El packowasp_llm es un mapeo de controles que se instala como política
real — cada entrada a continuación es un control que el gateway aplica, no una
descripción de intención. Los riesgos de alta señal se mapean a guardrails vivos y
una política de firewall; un riesgo (LLM05) es un control organizativo sin
superficie de aplicación en el gateway.
LLM01 — Inyección de prompts
LLM01 — Inyección de prompts
Un Guardrail en la entrada de la solicitud. El pack combina el preset de
seguridad Prompt-Injection Basics (marcado por palabras clave) con una regla
regex de jailbreak (modos DAN/STAN/AIM más contrabando de texto oculto con
tag-bytes Unicode) para atrapar los intentos de inyección directos y
ofuscados. Combínalo con una regla
llm_judge para la intención semántica de
inyección. Ver Inyección de
prompts y
Jailbreaks.LLM02 — Manejo inseguro de salida
LLM02 — Manejo inseguro de salida
Un Guardrail en la etapa de salida que bloquea las respuestas de modelo
que contienen payloads clásicos de inyección SQL (
UNION SELECT, OR 1=1,
DROP TABLE) antes de que lleguen a un sistema downstream que pueda
autoejecutarlos. Revisa las coincidencias en el feed de coincidencias de
Guardrails.LLM05 — Cadena de suministro
LLM05 — Cadena de suministro
Un control organizativo — el aseguramiento de la cadena de suministro de
tus modelos, datos y dependencias es un proceso que posees, no una
verificación del gateway en tiempo de solicitud. El pack lo lleva como
evidencia en el reporte para que tu auditor lo vea contabilizado. Para el lado
de runtime de las herramientas de terceros, ver Asegurar agentes de
IA.
LLM06 — Divulgación de información sensible
LLM06 — Divulgación de información sensible
Dos Guardrails: el Secrets & API-Key Blocker (rechaza las solicitudes que
portan credenciales AWS / OpenAI / GitHub) y un PII Blocker estricto (rechaza
las solicitudes que portan correos, números de teléfono, SSNs, tarjetas de
crédito o IPs). Ambos rechazan de forma dura en la solicitud antes de que
llegue al proveedor. Ver las secciones de PII y secretos de
Guardrails.
LLM07 — Filtración del prompt de sistema
LLM07 — Filtración del prompt de sistema
Un Guardrail en la etapa de salida que bloquea las respuestas de modelo
que repiten tokens de control de plantilla de chat (
<|system|>,
<|im_start|>) — evidencia clara de que el prompt de sistema se está
filtrando de vuelta. Ajusta la regla y revisa sus aciertos en el feed de
coincidencias.LLM08 — Agencia excesiva
LLM08 — Agencia excesiva
Una regla de política de Firewall que deniega las llamadas a herramienta
peligrosas de clase shell / exec — el control del plano de acción. Aquí es
donde el firewall, no un guardrail de contenido, hace el trabajo: evalúa las
llamadas a herramienta que tu modelo emite. Ver Llamadas a herramienta
peligrosas y Agencia
excesiva.
El pack cubre el subconjunto de alta señal de la lista OWASP que tiene una
superficie de aplicación concreta en el gateway — LLM01, LLM02, LLM06, LLM07,
LLM08 como controles aplicados, más LLM05 como evidencia organizativa. Los
riesgos que viven enteramente en tu propio código de aplicación (robo de modelo,
envenenamiento de datos de entrenamiento) están fuera de la ruta del gateway y
siguen siendo tuyos para abordar — ver Responsabilidad
compartida.
2. Por qué guardrails y firewall, no un solo control
La lista OWASP LLM abarca dos planos diferentes, y OrcaRouter divide sus controles a lo largo de la misma línea:| Plano | Cubre | Control |
|---|---|---|
| Contenido | LLM01, LLM02, LLM06, LLM07 | Guardrails |
| Acción | LLM08 | Firewall |
3. Instala el pack
Navegar el catálogo y la preparación es gratis para cualquier Member del espacio de trabajo. Instalar el pack materializa los guardrails y la política de firewall, y es una acción de Admin del espacio de trabajo restringida a un plan de pago. Hazlo desde la consola — Compliance → Catalog → OWASP LLM Top-10 → Install. La instalación crea reglas de guardrail y una política de firewall reales y editables en tu espacio de trabajo. Son tuyas para ajustar después — ajusta la lista de entidades de PII, cambia el deny de LLM08 por un veredictoaudit
mientras aprendes el comportamiento de tus agentes, o agrega una regla de
inyección llm_judge encima de la base de palabras clave/regex de LLM01. Adjunta
el guardrail a una clave vía guardrail_id y la política de firewall vía
firewall_policy_id, o establece cualquiera como valor por defecto del espacio de
trabajo.
4. Demuéstralo con un reporte firmado
La cobertura que no puedes mostrar no es cobertura. Después de que el pack se ejecuta, genera un reporte de cumplimiento — está firmado con Ed25519 y estampado con SHA256, exportable como CSV / JSON / PDF, y verificable públicamente sin una cuenta de OrcaRouter.Generar un reporte firmado
Qué captura el reporte y cómo se firma.
Verificar un reporte
Entrega a un auditor el endpoint público de verificación — sin cuenta
necesaria.
5. Dónde ir a continuación
Visión general de cumplimiento
El arco completo de instalar → aplicar → reportar → activar.
Qué hay en un pack
Cómo los controles de un pack se vuelven guardrails y política de firewall.
Todos los frameworks
Los otros packs de IA, seguridad y privacidad en el catálogo.
Asegurar agentes de IA
La línea base que endurece los agentes contra estos riesgos de principio a
fin.
