跳转到主要内容
如果你的安全团队问”这对照 OWASP LLM Top 10 表现如何?“,你想要 一个指向运行中控制的答案,而非一张幻灯片。OrcaRouter 把 OWASP Top 10 for LLM Applications 作为一个真实的可安装合规包 (owasp_llm)交付——不仅是一个清单视图。安装它会在每个到 api.orcarouter.ai 的请求已经穿越的同一路径上,实体化每个风险 所映射到的防护栏规则和防火墙策略,并把所捕获的内容快照进一份 你可以交给审计员的签名报告。 本页把每个被覆盖的 OWASP LLM 风险映射到执行它的 OrcaRouter 控制、 展示如何安装包,并链接到每个控制的深度参考。关于跨所有框架的 安装到上线弧线,请从 合规概览 开始。

1. OWASP LLM Top 10 映射到 OrcaRouter 控制

owasp_llm 包是一个作为真实策略安装的控制映射——下面每一项 都是网关执行的一个控制,而非意图的描述。高信号风险映射到实时 防护栏和一条防火墙策略;一个风险(LLM05)是一个没有网关执行 执行面的组织性控制。
请求输入上的一个防护栏。包把 Prompt-Injection Basics 安全 预设(关键词标记)与一条越狱 regex 规则(DAN/STAN/AIM 模式 外加 Unicode 标签字节隐藏文本走私)结合,以捕获直接和混淆的 注入尝试。把它与一条 llm_judge 规则配对以应对语义注入意图。 参见 提示注入越狱
输出阶段的一个防护栏,在包含经典 SQL 注入载荷 (UNION SELECTOR 1=1DROP TABLE)的模型响应到达可能 自动执行它们的下游系统之前拦截它们。在 防护栏 匹配信息流中审视匹配。
一个组织性控制——对你的模型、数据和依赖的供应链保证是 一个你拥有的流程,而非一个请求时的网关检查。包把它作为报告 中的证据携带,于是你的审计员看到它被计入。关于第三方工具的 运行时一侧,参见 保护 AI 智能体
两个防护栏:Secrets & API-Key Blocker(拒绝携带 AWS / OpenAI / GitHub 凭据的请求)和一个严格的 PII Blocker(拒绝 携带 email、电话号码、SSN、信用卡或 IP 的请求)。两者都在 请求到达提供商之前硬拒绝。参见 防护栏 的 PII 和密钥章节。
输出阶段的一个防护栏,拦截回显聊天模板控制令牌 (<|system|><|im_start|>)的模型响应——系统提示词正被 泄漏回来的明确证据。调优该规则并在匹配信息流中审视它的命中。
一条防火墙策略规则,拒绝危险的 shell / exec 类工具调用 ——动作平面控制。这是防火墙(而非内容防护栏)做工作的地方: 它评估你的模型发出的工具调用。参见 危险工具调用过度自主权
包覆盖 OWASP 列表中具有具体网关执行执行面的高信号子集——LLM01、 LLM02、LLM06、LLM07、LLM08 作为被执行的控制,外加 LLM05 作为 组织性证据。完全存在于你自己应用代码中的风险(模型窃取、训练 数据投毒)在网关路径之外,仍归你处理——参见 责任共担

2. 为什么是防护栏和防火墙,而非一个控制

OWASP LLM 列表横跨两个不同的平面,而 OrcaRouter 沿同一界线分割 它的控制:
平面覆盖控制
内容LLM01、LLM02、LLM06、LLM07防护栏
动作LLM08防火墙
防护栏筛查提示词和响应文本;防火墙评估工具调用和出站 动作。过度自主权(LLM08)是一个动作问题,所以它映射到一条 防火墙规则——而非一个内容过滤器。这种区分正是全部要点:阅读 防护栏 vs 防火墙 了解为什么单个控制无法覆盖两者。

3. 安装包

浏览目录和就绪度对任何工作区 Member 免费。安装包会实体化 防护栏和防火墙策略,且是一个门控到付费套餐的工作区 Admin 动作。从控制台做它——Compliance → Catalog → OWASP LLM Top-10 → Install
先在一个非生产工作区上安装,或以 shadow_mode 附加实体化的 防火墙策略,于是执行性判定记录为 [shadow] would … 而非拒绝。 观察防火墙事件和防护栏匹配信息流一周,然后在匹配看起来合适时 晋级为执行。
安装会在你的工作区中创建真实、可编辑的防护栏规则和一条 防火墙策略。它们之后归你调优——调整 PII 实体列表、在你了解你的 智能体行为期间把 LLM08 deny 换成一个 audit 判定,或在 LLM01 关键词/regex 基础之上加一条 llm_judge 注入规则。通过 guardrail_id 把防护栏附加到一个密钥,通过 firewall_policy_id 把防火墙策略附加上去,或把任一个设为工作区默认。

4. 用一份签名报告证明它

你无法展示的覆盖不是覆盖。包运行后,生成一份合规报告—— 它是 Ed25519 签名和 SHA256 戳记的,可导出为 CSV / JSON / PDF, 且在无 OrcaRouter 账户的情况下公开可验证

生成一份签名报告

报告快照什么以及它如何被签名。

验证一份报告

把公共验证端点交给审计员——无需账户。
报告列出每个 OWASP LLM 控制、支撑它的规则,以及它在报告窗口内 捕获的匹配——于是对”这对照 OWASP LLM Top 10 表现如何?“的答案 是一个签名制品,而非一句口头保证。

5. 接下来去哪里

合规概览

完整的安装 → 执行 → 报告 → 上线弧线。

一个包里有什么

一个包的控制如何变成防护栏和防火墙策略。

所有框架

目录中其他的 AI、安全和隐私包。

保护 AI 智能体

端到端地针对这些风险加固智能体的基线。
OrcaRouter 上的 OWASP LLM 覆盖是运行中的策略,而非一份清单: 一次安装接线每个风险所映射到的防护栏和防火墙规则,一份报告 证明它们触发了。