OWASP LLM Top 10 覆盖

如果你的安全团队问”这对照 OWASP LLM Top 10 表现如何？“，你想要一个指向运行中控制的答案，而非一张幻灯片。OrcaRouter 把 OWASP Top 10 for LLM Applications 作为一个真实的可安装合规包（owasp_llm）交付——不仅是一个清单视图。安装它会在每个到 api.orcarouter.ai 的请求已经穿越的同一路径上，实体化每个风险所映射到的防护栏规则和防火墙策略，并把所捕获的内容快照进一份你可以交给审计员的签名报告。本页把每个被覆盖的 OWASP LLM 风险映射到执行它的 OrcaRouter 控制、展示如何安装包，并链接到每个控制的深度参考。关于跨所有框架的安装到上线弧线，请从合规概览开始。

1. OWASP LLM Top 10 映射到 OrcaRouter 控制

owasp_llm 包是一个作为真实策略安装的控制映射——下面每一项都是网关执行的一个控制，而非意图的描述。高信号风险映射到实时防护栏和一条防火墙策略；一个风险（LLM05）是一个没有网关执行执行面的组织性控制。

LLM01 —— 提示注入

请求输入上的一个防护栏。包把 Prompt-Injection Basics 安全预设（关键词标记）与一条越狱 regex 规则（DAN/STAN/AIM 模式外加 Unicode 标签字节隐藏文本走私）结合，以捕获直接和混淆的注入尝试。把它与一条 llm_judge 规则配对以应对语义注入意图。参见提示注入和越狱。

LLM02 —— 不安全输出处理

输出阶段的一个防护栏，在包含经典 SQL 注入载荷（UNION SELECT、OR 1=1、DROP TABLE）的模型响应到达可能自动执行它们的下游系统之前拦截它们。在防护栏匹配信息流中审视匹配。

LLM05 —— 供应链

一个组织性控制——对你的模型、数据和依赖的供应链保证是一个你拥有的流程，而非一个请求时的网关检查。包把它作为报告中的证据携带，于是你的审计员看到它被计入。关于第三方工具的运行时一侧，参见保护 AI 智能体。

LLM06 —— 敏感信息泄露

两个防护栏：Secrets & API-Key Blocker（拒绝携带 AWS / OpenAI / GitHub 凭据的请求）和一个严格的 PII Blocker（拒绝携带 email、电话号码、SSN、信用卡或 IP 的请求）。两者都在请求到达提供商之前硬拒绝。参见防护栏的 PII 和密钥章节。

LLM07 —— 系统提示词泄漏

输出阶段的一个防护栏，拦截回显聊天模板控制令牌（<|system|>、<|im_start|>）的模型响应——系统提示词正被泄漏回来的明确证据。调优该规则并在匹配信息流中审视它的命中。

LLM08 —— 过度自主权

一条防火墙策略规则，拒绝危险的 shell / exec 类工具调用 ——动作平面控制。这是防火墙（而非内容防护栏）做工作的地方：它评估你的模型发出的工具调用。参见危险工具调用和过度自主权。

包覆盖 OWASP 列表中具有具体网关执行执行面的高信号子集——LLM01、 LLM02、LLM06、LLM07、LLM08 作为被执行的控制，外加 LLM05 作为组织性证据。完全存在于你自己应用代码中的风险（模型窃取、训练数据投毒）在网关路径之外，仍归你处理——参见责任共担。

2. 为什么是防护栏和防火墙，而非一个控制

OWASP LLM 列表横跨两个不同的平面，而 OrcaRouter 沿同一界线分割它的控制：

平面	覆盖	控制
内容	LLM01、LLM02、LLM06、LLM07	防护栏
动作	LLM08	防火墙

防护栏筛查提示词和响应文本；防火墙评估工具调用和出站动作。过度自主权（LLM08）是一个动作问题，所以它映射到一条防火墙规则——而非一个内容过滤器。这种区分正是全部要点：阅读防护栏 vs 防火墙了解为什么单个控制无法覆盖两者。

3. 安装包

浏览目录和就绪度对任何工作区 Member 免费。安装包会实体化防护栏和防火墙策略，且是一个门控到付费套餐的工作区 Admin 动作。从控制台做它——Compliance → Catalog → OWASP LLM Top-10 → Install。

先在一个非生产工作区上安装，或以 shadow_mode 附加实体化的防火墙策略，于是执行性判定记录为 [shadow] would … 而非拒绝。观察防火墙事件和防护栏匹配信息流一周，然后在匹配看起来合适时晋级为执行。

安装会在你的工作区中创建真实、可编辑的防护栏规则和一条防火墙策略。它们之后归你调优——调整 PII 实体列表、在你了解你的智能体行为期间把 LLM08 deny 换成一个 audit 判定，或在 LLM01 关键词/regex 基础之上加一条 llm_judge 注入规则。通过 guardrail_id 把防护栏附加到一个密钥，通过 firewall_policy_id 把防火墙策略附加上去，或把任一个设为工作区默认。

4. 用一份签名报告证明它

你无法展示的覆盖不是覆盖。包运行后，生成一份合规报告—— 它是 Ed25519 签名和 SHA256 戳记的，可导出为 CSV / JSON / PDF，且在无 OrcaRouter 账户的情况下公开可验证。

生成一份签名报告

报告快照什么以及它如何被签名。

验证一份报告

把公共验证端点交给审计员——无需账户。

报告列出每个 OWASP LLM 控制、支撑它的规则，以及它在报告窗口内捕获的匹配——于是对”这对照 OWASP LLM Top 10 表现如何？“的答案是一个签名制品，而非一句口头保证。

5. 接下来去哪里

合规概览

完整的安装 → 执行 → 报告 → 上线弧线。

一个包里有什么

一个包的控制如何变成防护栏和防火墙策略。

所有框架

目录中其他的 AI、安全和隐私包。

保护 AI 智能体

端到端地针对这些风险加固智能体的基线。

OrcaRouter 上的 OWASP LLM 覆盖是运行中的策略，而非一份清单：一次安装接线每个风险所映射到的防护栏和防火墙规则，一份报告证明它们触发了。

​1. OWASP LLM Top 10 映射到 OrcaRouter 控制

​2. 为什么是防护栏和防火墙，而非一个控制

​3. 安装包

​4. 用一份签名报告证明它

生成一份签名报告

验证一份报告

​5. 接下来去哪里

合规概览

一个包里有什么

所有框架

保护 AI 智能体

1. OWASP LLM Top 10 映射到 OrcaRouter 控制

2. 为什么是防护栏和防火墙，而非一个控制

3. 安装包

4. 用一份签名报告证明它

5. 接下来去哪里