owasp_llm) — а не только представление
чек-листа. Установка его материализует правила guardrail и политику firewall,
которым сопоставляется каждый риск, на том же пути, который каждый запрос к
api.orcarouter.ai уже пересекает, и снимает снимок того, что было поймано, в
подписанный отчёт, который вы можете передать аудитору.
Эта страница сопоставляет каждый покрытый риск OWASP LLM контролю OrcaRouter,
который его применяет, показывает, как установить пакет, и ссылается на
глубокий справочник по каждому контролю. По поводу дуги
установка-и-выход-в-live по всем фреймворкам начните с
Обзора комплаенса.
1. owasp llm top 10, сопоставленный контролям OrcaRouter
Пакетowasp_llm — это сопоставление контролей, которое устанавливается как
реальная политика — каждая запись ниже — это контроль, который применяет
шлюз, а не описание намерения. Высокосигнальные риски сопоставляются живым
guardrails и политике firewall; один риск (LLM05) — организационный контроль
без поверхности применения шлюза.
LLM01 — Prompt injection
LLM01 — Prompt injection
Guardrail на входе запроса. Пакет комбинирует пресет безопасности
Prompt-Injection Basics (флагирование по ключевым словам) с правилом regex
jailbreak (режимы DAN/STAN/AIM плюс контрабанда скрытого текста через
Unicode tag-байты), чтобы поймать прямые и обфусцированные попытки инъекций.
Сочетайте его с правилом
llm_judge для семантического намерения инъекции.
См. Prompt injection и
Jailbreaks.LLM02 — Небезопасная обработка вывода
LLM02 — Небезопасная обработка вывода
Guardrail на стадии вывода, который блокирует ответы модели,
содержащие классические нагрузки SQL-инъекций (
UNION SELECT, OR 1=1,
DROP TABLE) до того, как они достигнут нижестоящей системы, которая может
их авто-выполнить. Просматривайте совпадения в ленте совпадений
Guardrails.LLM05 — Цепочка поставок
LLM05 — Цепочка поставок
Организационный контроль — гарантия цепочки поставок для ваших моделей,
данных и зависимостей — это процесс, которым вы владеете, а не проверка
шлюза во время запроса. Пакет несёт его как доказательство в отчёте, так
что ваш аудитор видит, что он учтён. По поводу рантайм-стороны сторонних
инструментов см. Защиту ИИ-агентов.
LLM06 — Раскрытие чувствительной информации
LLM06 — Раскрытие чувствительной информации
Два Guardrails: Secrets & API-Key Blocker (отклоняет запросы, несущие
учётные данные AWS / OpenAI / GitHub) и строгий PII Blocker (отклоняет
запросы, несущие email, телефонные номера, SSN, кредитные карты или IP).
Оба жёстко отклоняют на запросе до того, как он достигнет провайдера. См.
секции PII и секретов в Guardrails.
LLM07 — Утечка системного промпта
LLM07 — Утечка системного промпта
Guardrail на стадии вывода, который блокирует ответы модели,
отражающие контрольные токены chat-шаблона (
<|system|>, <|im_start|>)
— явное доказательство того, что системный промпт утекает обратно.
Настройте правило и просмотрите его срабатывания в ленте совпадений.LLM08 — Избыточная автономия
LLM08 — Избыточная автономия
Правило политики Firewall, которое отклоняет опасные вызовы
инструментов класса shell / exec — контроль плоскости действий. Это где
firewall, а не content-guardrail, делает работу: он вычисляет вызовы
инструментов, которые выдаёт ваша модель. См.
Опасные вызовы инструментов и
Избыточную автономию.
Пакет покрывает высокосигнальное подмножество списка OWASP, у которого есть
конкретная поверхность применения шлюза — LLM01, LLM02, LLM06, LLM07, LLM08
как применяемые контроли, плюс LLM05 как организационное доказательство. Риски,
которые живут целиком в коде вашего собственного приложения (кража модели,
отравление данных обучения), находятся вне пути шлюза и остаются вашими для
решения — см.
Разделённую ответственность.
2. Почему guardrails и firewall, а не один контроль
Список OWASP LLM охватывает две разные плоскости, и OrcaRouter разделяет свои контроли по той же линии:| Плоскость | Покрывает | Контроль |
|---|---|---|
| Содержимое | LLM01, LLM02, LLM06, LLM07 | Guardrails |
| Действие | LLM08 | Firewall |
3. Установите пакет
Просмотр каталога и готовности бесплатен для любого Member рабочего пространства. Установка пакета материализует guardrails и политику firewall, и это действие Admin рабочего пространства, шлюзованное за платным планом. Делайте это из консоли — Compliance → Catalog → OWASP LLM Top-10 → Install. Установка создаёт реальные, редактируемые правила guardrail и политику firewall в вашем рабочем пространстве. Они ваши для настройки потом — скорректируйте список сущностей PII, поменяйте deny LLM08 на вердиктaudit,
пока изучаете поведение ваших агентов, или добавьте правило инъекций
llm_judge поверх базы по ключевым словам/regex LLM01. Привяжите guardrail к
ключу через guardrail_id, а политику firewall через firewall_policy_id,
или установите любую как default рабочего пространства.
4. Докажите это подписанным отчётом
Покрытие, которое вы не можете показать, — не покрытие. После того как пакет заработает, сгенерируйте отчёт комплаенса — он подписан Ed25519 и проштампован SHA256, экспортируем как CSV / JSON / PDF, и публично проверяем без аккаунта OrcaRouter.Сгенерировать подписанный отчёт
Что снимает снимком отчёт и как он подписан.
Проверка отчёта
Передайте аудитору публичный verify-эндпоинт — аккаунт не нужен.
5. Куда дальше
Обзор комплаенса
Полная дуга установка → применение → отчёт → go-live.
Что в пакете
Как контроли пакета становятся guardrails и политикой firewall.
Все фреймворки
Другие AI-, security- и privacy-пакеты в каталоге.
Защита ИИ-агентов
Базовый уровень, который укрепляет агентов против этих рисков от начала до
конца.
