Выравнивание по NIST AI RMF для ИИ-агентов

Вы выравниваете ИИ-агента по Фреймворку управления рисками ИИ NIST, и ваш ревьюер хочет видеть функции Govern / Map / Measure / Manage, подкреплённые чем-то, что реально работает — а не таблицей намерений. Пакет NIST AI RMF сопоставляет функции риска фреймворка реальным guardrails шлюза, материализует их в ваше рабочее пространство одним вызовом и позволяет запустить их в режиме наблюдения, прежде чем что-либо применится. Эта страница — специфичная для NIST AI RMF посадка поверх общего процесса комплаенса. По поводу механики, которую разделяет каждый пакет — сначала-наблюдение, шлюзование по плану, подписанный отчёт — начните с обзора комплаенса.

1. Что покрывает выравнивание nist ai rmf на шлюзе

Пакет nist_ai_rmf (NIST AI Risk Management Framework 1.0, юрисдикция US) сопоставляет три функции фреймворка guardrails content-плоскости. Каждая — реальное, редактируемое правило, построенное из той же библиотеки пресетов, против которой вы можете авторствовать вручную — откройте его, прочитайте, настройте, как любой другой guardrail.

MANAGE 2.1 — Защита от prompt-инъекций

Детектирует и флагирует попытки prompt-инъекций на запросе. Построена из пресета Prompt-Injection Basics — правила по ключевым словам, которое аннотирует распространённые jailbreak-фразы (ignore previous instructions, reveal your system prompt) на стадии input для разбора, не блокируя пользователя. Это рекомендуемый контроль пакета.

MEASURE 2.6 — Безопасность содержимого

Флагирует контент самоповреждения / небезопасный контент. Построена из пресета Self-Harm Keywords, который блокирует промпты на стадии input, спрашивающие, как себе навредить. Сочетайте его с вашим собственным процессом эскалации, так что заблокированный запрос поверхностируется человеку-ревьюеру с информацией о телефоне доверия.

GOVERN 1.2 — Логирование управления

Записывает решения guardrail как доказательство управления. Построена из пресета Compliance Logger (observe-only) — он логирует вхождения PII и решения политики по входу и выходу без блокировки или изменения трафика.

Это обязательства функций риска, которые может нести шлюз: детектирование на входах, блок безопасности и запись решений. Фреймворк также просит организационную работу, которую шлюз не может выполнить — ваши политики GOVERN 1.1 и структуру подотчётности — которую пакет несёт как строку Organizational: true, чтобы вы доказали её вне шлюза. См. разделённую ответственность.

2. Один конкретный пример: установка, наблюдение, выход в live

Работа с пакетами использует вашу консольную сессию (UserAuth) — не релейный ключ sk-orca-…. Просмотр каталога и проверка готовности бесплатны для любого Member рабочего пространства; установка — действие Admin рабочего пространства на платном плане, применяемое на стороне сервера, так что прямой API-вызов не может обойти шлюз.

Просмотрите и проверьте готовность (Member, бесплатно)

Откройте Compliance → Frameworks и выберите NIST AI RMF. Готовность показывает, как три контроля сопоставляются с вашими текущими политиками, прежде чем вы зафиксируетесь на чём-либо.

Установите пакет (Admin, платно)

Установка из консоли вызывает POST /api/compliance/packs/nist_ai_rmf/install. Один вызов материализует контроли в реальный, редактируемый guardrail, помеченный происхождением пакета — созданный в режиме наблюдения, так что он флагирует вместо блокировки, и вы собираете доказательства «would-have-blocked» на живом трафике, не влияя на него.

POST /api/compliance/packs/nist_ai_rmf/install

Наблюдайте за совпадениями

Просмотрите, что поймали бы контроли MANAGE и MEASURE в ленте совпадений Guardrails (GET /api/guardrail/match, Member). Настройте любое правило в консоли — это стандартный guardrail, так что каждый путь правки, версии и отката работает без изменений.

Выведите в live и привяжите

Переключите guardrail из режима наблюдения, когда доказательства выглядят правильно, затем привяжите его к ключам, которые используют ваши агенты, установив guardrail_id на ключе (или сделайте его default рабочего пространства). Теперь блок самоповреждения MEASURE 2.6 применяется на запросе до метеринга.

Никогда не передавайте релейный ключ sk-orca-… маршруту конфигурации. Маршруты /api/compliance/* и /api/guardrail/* аутентифицируются вашей консольной сессией, а не релейным ключом — только модельные вызовы /v1/* используют sk-orca-…. Установка, выход в live, отчёты и установка резидентности — шлюзованные действия Admin.

Результат guardrail_blocked от контроля MEASURE 2.6 — это HTTP 400, который не стоит квоты — блок на стадии input ловится до метеринга, и он помечен skip-retry, так что заблокированный небезопасный промпт никогда не сжигает траты и не зацикливается.

3. Отправьте подписанный, проверяемый отчёт

Когда вы применяете, сгенерируйте отчёт комплаенса: подписанный Ed25519, проштампованный SHA-256 артефакт, который вы можете экспортировать как CSV, JSON или PDF и передать ревьюеру. Любой может проверить его без аккаунта.

Покрытие по каждой функции с реальными счётчиками

Каждая строка контроля несёт свой статус — covered, observe, gap или attested — и сколько раз он реально сработал за период. Контроль MANAGE 2.1, который флагировал 2000 попыток инъекций, читается для ревьюера иначе, чем тот, у которого ноль совпадений, и отчёт показывает оба.

Происхождение

Каждый материализованный контроль записывает свой control_id (например, nistai.injection), дословную клаузу (NIST AI RMF MANAGE 2.1), плоскость и id живого guardrail, применяющего его — так что ревьюер проходит функция → контроль → применяющая политика → совпадения, без выведенного догадкой шага.

Публичная проверка

Получите подписывающий публичный ключ на GET /api/public/compliance/pubkey, отправьте отчёт на POST /api/public/compliance/verify или откройте скоупнутую ссылку-шеринг для ревьюера на GET /api/public/compliance/share/:token. Аккаунт не требуется.

См. подписанный отчёт для полной раскладки от обложки до футера и Проверку отчёта для разбора проверки.

4. Проштампуйте регионом ваши доказательства NIST AI RMF

Отчёты проштампованы и хранятся под вашим заявленным регионом резидентности данных (us / eu / uk / ap / cn / global); отчёт отдаётся только под совпадающим регионом, а межрегиональные чтения удерживаются. Admin рабочего пространства устанавливает его через PUT /api/compliance/residency.

Резидентность — это регион артефакта отчёта комплаенса, а не гео-привязка того, где запускается инференс. Она управляет тем, где живут ваши подписанные доказательства и кто может их прочитать, а не тем, куда маршрутизируется модельный трафик. См. резидентность данных и межрегиональные.

Логи запросов по умолчанию удерживаются 30 дней (ограничено сервером до 180-дневного жёсткого максимума), а удаление пользователя запускает 30-дневное льготное окно, затем вычистку PII — оба релевантны, когда ревьюер спрашивает о вашей позиции удержания. См. Удержание и Право на удаление.

5. NIST AI RMF рядом с остальной частью вашей программы

AI RMF редко приходит один. Тот же процесс установки покрывает смежные фреймворки AI-управления и безопасности LLM, каждый материализует свои собственные редактируемые контроли:

Пакет	Фреймворк
`iso_42001`	Система управления ИИ ISO/IEC 42001
`eu_ai_act`	Закон ЕС об искусственном интеллекте
`owasp_llm`	OWASP Top 10 для приложений LLM

ISO 42001

Доказательства системы управления ИИ.

EU AI Act

Запрещённые практики, прозрачность, ведение записей.

OWASP LLM Top 10

Высокосигнальные риски безопасности LLM как пакет.

Контроль prompt-инъекций MANAGE 2.1 — это защита шлюза от той же угрозы, которую ваши политики безопасности уже отслеживают. Если вы хотите укрепить его независимо от пакета комплаенса, справочник guardrail идёт глубже.

6. Куда дальше

Установка пакета

Полная механика установки, разделяемая всеми фреймворками.

Наблюдение vs применение

Как режим наблюдения превращается в живое применение, осознанно.

Справочник Guardrails

Контроли content-плоскости, из которых построен пакет NIST AI RMF.

Prompt injection

Угроза, от которой защищает контроль MANAGE 2.1.

Установите в режиме наблюдения, понаблюдайте, что поймали бы контроли Map/Measure/Manage, выведите их в live на ключах ваших агентов, затем отправьте подписанный отчёт. Это выравнивание nist ai rmf как конфигурация, а не проект.

​1. Что покрывает выравнивание nist ai rmf на шлюзе

​2. Один конкретный пример: установка, наблюдение, выход в live

​3. Отправьте подписанный, проверяемый отчёт

​4. Проштампуйте регионом ваши доказательства NIST AI RMF

​5. NIST AI RMF рядом с остальной частью вашей программы

ISO 42001

EU AI Act

OWASP LLM Top 10

​6. Куда дальше

Установка пакета

Наблюдение vs применение

Справочник Guardrails

Prompt injection

1. Что покрывает выравнивание nist ai rmf на шлюзе

2. Один конкретный пример: установка, наблюдение, выход в live

3. Отправьте подписанный, проверяемый отчёт

4. Проштампуйте регионом ваши доказательства NIST AI RMF

5. NIST AI RMF рядом с остальной частью вашей программы

6. Куда дальше