Покрытие OWASP LLM Top 10

Если ваша команда безопасности спрашивает «как это держится против OWASP LLM Top 10?», вы хотите ответ, который указывает на работающие контроли, а не на слайд. OrcaRouter поставляет OWASP Top 10 для приложений LLM как реальный устанавливаемый пакет комплаенса (owasp_llm) — а не только представление чек-листа. Установка его материализует правила guardrail и политику firewall, которым сопоставляется каждый риск, на том же пути, который каждый запрос к api.orcarouter.ai уже пересекает, и снимает снимок того, что было поймано, в подписанный отчёт, который вы можете передать аудитору. Эта страница сопоставляет каждый покрытый риск OWASP LLM контролю OrcaRouter, который его применяет, показывает, как установить пакет, и ссылается на глубокий справочник по каждому контролю. По поводу дуги установка-и-выход-в-live по всем фреймворкам начните с Обзора комплаенса.

1. owasp llm top 10, сопоставленный контролям OrcaRouter

Пакет owasp_llm — это сопоставление контролей, которое устанавливается как реальная политика — каждая запись ниже — это контроль, который применяет шлюз, а не описание намерения. Высокосигнальные риски сопоставляются живым guardrails и политике firewall; один риск (LLM05) — организационный контроль без поверхности применения шлюза.

LLM01 — Prompt injection

Guardrail на входе запроса. Пакет комбинирует пресет безопасности Prompt-Injection Basics (флагирование по ключевым словам) с правилом regex jailbreak (режимы DAN/STAN/AIM плюс контрабанда скрытого текста через Unicode tag-байты), чтобы поймать прямые и обфусцированные попытки инъекций. Сочетайте его с правилом llm_judge для семантического намерения инъекции. См. Prompt injection и Jailbreaks.

LLM02 — Небезопасная обработка вывода

Guardrail на стадии вывода, который блокирует ответы модели, содержащие классические нагрузки SQL-инъекций (UNION SELECT, OR 1=1, DROP TABLE) до того, как они достигнут нижестоящей системы, которая может их авто-выполнить. Просматривайте совпадения в ленте совпадений Guardrails.

LLM05 — Цепочка поставок

Организационный контроль — гарантия цепочки поставок для ваших моделей, данных и зависимостей — это процесс, которым вы владеете, а не проверка шлюза во время запроса. Пакет несёт его как доказательство в отчёте, так что ваш аудитор видит, что он учтён. По поводу рантайм-стороны сторонних инструментов см. Защиту ИИ-агентов.

LLM06 — Раскрытие чувствительной информации

Два Guardrails: Secrets & API-Key Blocker (отклоняет запросы, несущие учётные данные AWS / OpenAI / GitHub) и строгий PII Blocker (отклоняет запросы, несущие email, телефонные номера, SSN, кредитные карты или IP). Оба жёстко отклоняют на запросе до того, как он достигнет провайдера. См. секции PII и секретов в Guardrails.

LLM07 — Утечка системного промпта

Guardrail на стадии вывода, который блокирует ответы модели, отражающие контрольные токены chat-шаблона (<|system|>, <|im_start|>) — явное доказательство того, что системный промпт утекает обратно. Настройте правило и просмотрите его срабатывания в ленте совпадений.

LLM08 — Избыточная автономия

Правило политики Firewall, которое отклоняет опасные вызовы инструментов класса shell / exec — контроль плоскости действий. Это где firewall, а не content-guardrail, делает работу: он вычисляет вызовы инструментов, которые выдаёт ваша модель. См. Опасные вызовы инструментов и Избыточную автономию.

Пакет покрывает высокосигнальное подмножество списка OWASP, у которого есть конкретная поверхность применения шлюза — LLM01, LLM02, LLM06, LLM07, LLM08 как применяемые контроли, плюс LLM05 как организационное доказательство. Риски, которые живут целиком в коде вашего собственного приложения (кража модели, отравление данных обучения), находятся вне пути шлюза и остаются вашими для решения — см. Разделённую ответственность.

2. Почему guardrails и firewall, а не один контроль

Список OWASP LLM охватывает две разные плоскости, и OrcaRouter разделяет свои контроли по той же линии:

Плоскость	Покрывает	Контроль
Содержимое	LLM01, LLM02, LLM06, LLM07	Guardrails
Действие	LLM08	Firewall

Guardrails просеивают текст промпта и ответа; firewall вычисляет вызовы инструментов и исходящие действия. Избыточная автономия (LLM08) — это проблема действия, так что она сопоставляется правилу firewall — не content-фильтру. Разделение и есть весь смысл: прочитайте Guardrails vs Firewall о том, почему один контроль не может покрыть оба.

3. Установите пакет

Просмотр каталога и готовности бесплатен для любого Member рабочего пространства. Установка пакета материализует guardrails и политику firewall, и это действие Admin рабочего пространства, шлюзованное за платным планом. Делайте это из консоли — Compliance → Catalog → OWASP LLM Top-10 → Install.

Установите сначала на непродакшн-рабочем пространстве или привяжите материализованную политику firewall в shadow_mode, так что применяющие вердикты логируются как [shadow] would … вместо отклонения. Понаблюдайте за событиями firewall и лентой совпадений guardrail неделю, затем продвиньте в применение, как только совпадения выглядят правильно.

Установка создаёт реальные, редактируемые правила guardrail и политику firewall в вашем рабочем пространстве. Они ваши для настройки потом — скорректируйте список сущностей PII, поменяйте deny LLM08 на вердикт audit, пока изучаете поведение ваших агентов, или добавьте правило инъекций llm_judge поверх базы по ключевым словам/regex LLM01. Привяжите guardrail к ключу через guardrail_id, а политику firewall через firewall_policy_id, или установите любую как default рабочего пространства.

4. Докажите это подписанным отчётом

Покрытие, которое вы не можете показать, — не покрытие. После того как пакет заработает, сгенерируйте отчёт комплаенса — он подписан Ed25519 и проштампован SHA256, экспортируем как CSV / JSON / PDF, и публично проверяем без аккаунта OrcaRouter.

Сгенерировать подписанный отчёт

Что снимает снимком отчёт и как он подписан.

Проверка отчёта

Передайте аудитору публичный verify-эндпоинт — аккаунт не нужен.

Отчёт перечисляет каждый контроль OWASP LLM, правило, которое его подкрепляет, и совпадения, которые он поймал в отчётном окне — так что ответ на «как это держится против owasp llm top 10?» — это подписанный артефакт, а не словесное заверение.

5. Куда дальше

Обзор комплаенса

Полная дуга установка → применение → отчёт → go-live.

Что в пакете

Как контроли пакета становятся guardrails и политикой firewall.

Все фреймворки

Другие AI-, security- и privacy-пакеты в каталоге.

Защита ИИ-агентов

Базовый уровень, который укрепляет агентов против этих рисков от начала до конца.

Покрытие OWASP LLM в OrcaRouter — это работающая политика, а не чек-лист: одна установка подключает guardrails и правила firewall, которым сопоставляется каждый риск, а один отчёт доказывает, что они сработали.

NIST AI RMF PCI DSS

​1. owasp llm top 10, сопоставленный контролям OrcaRouter

​2. Почему guardrails и firewall, а не один контроль

​3. Установите пакет

​4. Докажите это подписанным отчётом