Cobertura del OWASP LLM Top 10

Si tu equipo de seguridad pregunta “¿cómo resiste esto frente al OWASP LLM Top 10?”, quieres una respuesta que apunte a controles en ejecución, no una diapositiva. OrcaRouter envía el OWASP Top 10 para Aplicaciones LLM como un pack de cumplimiento instalable real (owasp_llm) — no solo una vista de lista de verificación. Instalarlo materializa las reglas de guardrail y la política de firewall a las que se mapea cada riesgo, en la misma ruta que cada solicitud a api.orcarouter.ai ya cruza, y captura lo que se atrapó en un reporte firmado que puedes entregar a un auditor. Esta página mapea cada riesgo OWASP LLM cubierto al control de OrcaRouter que lo aplica, muestra cómo instalar el pack, y enlaza a la referencia profunda de cada control. Para el arco de instalar-y-poner-en-marcha en todos los frameworks, empieza en la Visión general de cumplimiento.

1. owasp llm top 10 mapeado a controles de OrcaRouter

El pack owasp_llm es un mapeo de controles que se instala como política real — cada entrada a continuación es un control que el gateway aplica, no una descripción de intención. Los riesgos de alta señal se mapean a guardrails vivos y una política de firewall; un riesgo (LLM05) es un control organizativo sin superficie de aplicación en el gateway.

LLM01 — Inyección de prompts

Un Guardrail en la entrada de la solicitud. El pack combina el preset de seguridad Prompt-Injection Basics (marcado por palabras clave) con una regla regex de jailbreak (modos DAN/STAN/AIM más contrabando de texto oculto con tag-bytes Unicode) para atrapar los intentos de inyección directos y ofuscados. Combínalo con una regla llm_judge para la intención semántica de inyección. Ver Inyección de prompts y Jailbreaks.

LLM02 — Manejo inseguro de salida

Un Guardrail en la etapa de salida que bloquea las respuestas de modelo que contienen payloads clásicos de inyección SQL (UNION SELECT, OR 1=1, DROP TABLE) antes de que lleguen a un sistema downstream que pueda autoejecutarlos. Revisa las coincidencias en el feed de coincidencias de Guardrails.

LLM05 — Cadena de suministro

Un control organizativo — el aseguramiento de la cadena de suministro de tus modelos, datos y dependencias es un proceso que posees, no una verificación del gateway en tiempo de solicitud. El pack lo lleva como evidencia en el reporte para que tu auditor lo vea contabilizado. Para el lado de runtime de las herramientas de terceros, ver Asegurar agentes de IA.

LLM06 — Divulgación de información sensible

Dos Guardrails: el Secrets & API-Key Blocker (rechaza las solicitudes que portan credenciales AWS / OpenAI / GitHub) y un PII Blocker estricto (rechaza las solicitudes que portan correos, números de teléfono, SSNs, tarjetas de crédito o IPs). Ambos rechazan de forma dura en la solicitud antes de que llegue al proveedor. Ver las secciones de PII y secretos de Guardrails.

LLM07 — Filtración del prompt de sistema

Un Guardrail en la etapa de salida que bloquea las respuestas de modelo que repiten tokens de control de plantilla de chat (<|system|>, <|im_start|>) — evidencia clara de que el prompt de sistema se está filtrando de vuelta. Ajusta la regla y revisa sus aciertos en el feed de coincidencias.

LLM08 — Agencia excesiva

Una regla de política de Firewall que deniega las llamadas a herramienta peligrosas de clase shell / exec — el control del plano de acción. Aquí es donde el firewall, no un guardrail de contenido, hace el trabajo: evalúa las llamadas a herramienta que tu modelo emite. Ver Llamadas a herramienta peligrosas y Agencia excesiva.

El pack cubre el subconjunto de alta señal de la lista OWASP que tiene una superficie de aplicación concreta en el gateway — LLM01, LLM02, LLM06, LLM07, LLM08 como controles aplicados, más LLM05 como evidencia organizativa. Los riesgos que viven enteramente en tu propio código de aplicación (robo de modelo, envenenamiento de datos de entrenamiento) están fuera de la ruta del gateway y siguen siendo tuyos para abordar — ver Responsabilidad compartida.

2. Por qué guardrails y firewall, no un solo control

La lista OWASP LLM abarca dos planos diferentes, y OrcaRouter divide sus controles a lo largo de la misma línea:

Plano	Cubre	Control
Contenido	LLM01, LLM02, LLM06, LLM07	Guardrails
Acción	LLM08	Firewall

Los guardrails examinan el texto de prompt y respuesta; el firewall evalúa las llamadas a herramienta y acciones salientes. La agencia excesiva (LLM08) es un problema de acción, así que se mapea a una regla de firewall — no a un filtro de contenido. La división es todo el punto: lee Guardrails vs Firewall para por qué un solo control no puede cubrir ambos.

3. Instala el pack

Navegar el catálogo y la preparación es gratis para cualquier Member del espacio de trabajo. Instalar el pack materializa los guardrails y la política de firewall, y es una acción de Admin del espacio de trabajo restringida a un plan de pago. Hazlo desde la consola — Compliance → Catalog → OWASP LLM Top-10 → Install.

Instala en un espacio de trabajo que no sea de producción primero, o adjunta la política de firewall materializada en shadow_mode para que los veredictos que aplican se registren como [shadow] would … en vez de denegar. Observa los eventos de firewall y el feed de coincidencias de guardrail durante una semana, luego promueve a aplicación una vez que las coincidencias se vean bien.

La instalación crea reglas de guardrail y una política de firewall reales y editables en tu espacio de trabajo. Son tuyas para ajustar después — ajusta la lista de entidades de PII, cambia el deny de LLM08 por un veredicto audit mientras aprendes el comportamiento de tus agentes, o agrega una regla de inyección llm_judge encima de la base de palabras clave/regex de LLM01. Adjunta el guardrail a una clave vía guardrail_id y la política de firewall vía firewall_policy_id, o establece cualquiera como valor por defecto del espacio de trabajo.

4. Demuéstralo con un reporte firmado

La cobertura que no puedes mostrar no es cobertura. Después de que el pack se ejecuta, genera un reporte de cumplimiento — está firmado con Ed25519 y estampado con SHA256, exportable como CSV / JSON / PDF, y verificable públicamente sin una cuenta de OrcaRouter.

Generar un reporte firmado

Qué captura el reporte y cómo se firma.

Verificar un reporte

Entrega a un auditor el endpoint público de verificación — sin cuenta necesaria.

El reporte lista cada control OWASP LLM, la regla que lo respalda, y las coincidencias que atrapó en la ventana de reporte — así que la respuesta a “¿cómo resiste esto frente al owasp llm top 10?” es un artefacto firmado, no una garantía verbal.

5. Dónde ir a continuación

Visión general de cumplimiento

El arco completo de instalar → aplicar → reportar → activar.

Qué hay en un pack

Cómo los controles de un pack se vuelven guardrails y política de firewall.

Todos los frameworks

Los otros packs de IA, seguridad y privacidad en el catálogo.

Asegurar agentes de IA

La línea base que endurece los agentes contra estos riesgos de principio a fin.

La cobertura de OWASP LLM en OrcaRouter es política en ejecución, no una lista de verificación: una instalación conecta los guardrails y las reglas de firewall a los que se mapea cada riesgo, y un reporte demuestra que se dispararon.

NIST AI RMF PCI DSS

​1. owasp llm top 10 mapeado a controles de OrcaRouter

​2. Por qué guardrails y firewall, no un solo control

​3. Instala el pack

​4. Demuéstralo con un reporte firmado

Generar un reporte firmado

Verificar un reporte

​5. Dónde ir a continuación

Visión general de cumplimiento

Qué hay en un pack

Todos los frameworks

Asegurar agentes de IA

1. owasp llm top 10 mapeado a controles de OrcaRouter

2. Por qué guardrails y firewall, no un solo control

3. Instala el pack

4. Demuéstralo con un reporte firmado

5. Dónde ir a continuación