1. Что покрывает выравнивание nist ai rmf на шлюзе
Пакетnist_ai_rmf (NIST AI Risk Management Framework 1.0, юрисдикция US)
сопоставляет три функции фреймворка guardrails content-плоскости. Каждая —
реальное, редактируемое правило, построенное из той же библиотеки пресетов,
против которой вы можете авторствовать вручную — откройте его, прочитайте,
настройте, как любой другой guardrail.
MANAGE 2.1 — Защита от prompt-инъекций
MANAGE 2.1 — Защита от prompt-инъекций
Детектирует и флагирует попытки prompt-инъекций на запросе. Построена из
пресета Prompt-Injection Basics — правила по ключевым словам, которое
аннотирует распространённые jailbreak-фразы (
ignore previous instructions, reveal your system prompt) на стадии input для разбора,
не блокируя пользователя. Это рекомендуемый контроль пакета.MEASURE 2.6 — Безопасность содержимого
MEASURE 2.6 — Безопасность содержимого
Флагирует контент самоповреждения / небезопасный контент. Построена из
пресета Self-Harm Keywords, который блокирует промпты на стадии input,
спрашивающие, как себе навредить. Сочетайте его с вашим собственным
процессом эскалации, так что заблокированный запрос поверхностируется
человеку-ревьюеру с информацией о телефоне доверия.
GOVERN 1.2 — Логирование управления
GOVERN 1.2 — Логирование управления
Записывает решения guardrail как доказательство управления. Построена из
пресета Compliance Logger (observe-only) — он логирует вхождения PII и
решения политики по входу и выходу без блокировки или изменения трафика.
Это обязательства функций риска, которые может нести шлюз: детектирование
на входах, блок безопасности и запись решений. Фреймворк также просит
организационную работу, которую шлюз не может выполнить — ваши политики GOVERN
1.1 и структуру подотчётности — которую пакет несёт как строку
Organizational: true, чтобы вы доказали её вне шлюза. См.
разделённую ответственность.2. Один конкретный пример: установка, наблюдение, выход в live
Работа с пакетами использует вашу консольную сессию (UserAuth) — не релейный ключsk-orca-…. Просмотр каталога и проверка готовности бесплатны
для любого Member рабочего пространства; установка — действие Admin
рабочего пространства на платном плане, применяемое на стороне сервера,
так что прямой API-вызов не может обойти шлюз.
Просмотрите и проверьте готовность (Member, бесплатно)
Откройте Compliance → Frameworks и выберите NIST AI RMF.
Готовность показывает, как три контроля сопоставляются с вашими текущими
политиками, прежде чем вы зафиксируетесь на чём-либо.
Установите пакет (Admin, платно)
Установка из консоли вызывает
POST /api/compliance/packs/nist_ai_rmf/install. Один вызов материализует
контроли в реальный, редактируемый guardrail, помеченный происхождением
пакета — созданный в режиме наблюдения, так что он флагирует вместо
блокировки, и вы собираете доказательства «would-have-blocked» на живом
трафике, не влияя на него.Наблюдайте за совпадениями
Просмотрите, что поймали бы контроли MANAGE и MEASURE в ленте совпадений
Guardrails (
GET /api/guardrail/match, Member). Настройте любое
правило в консоли — это стандартный guardrail, так что каждый путь правки,
версии и отката работает без изменений.Выведите в live и привяжите
Переключите guardrail из режима наблюдения, когда доказательства выглядят
правильно, затем привяжите его к ключам, которые используют ваши агенты,
установив
guardrail_id на ключе (или сделайте его default рабочего
пространства). Теперь блок самоповреждения MEASURE 2.6 применяется на
запросе до метеринга.3. Отправьте подписанный, проверяемый отчёт
Когда вы применяете, сгенерируйте отчёт комплаенса: подписанный Ed25519, проштампованный SHA-256 артефакт, который вы можете экспортировать как CSV, JSON или PDF и передать ревьюеру. Любой может проверить его без аккаунта.Покрытие по каждой функции с реальными счётчиками
Покрытие по каждой функции с реальными счётчиками
Каждая строка контроля несёт свой статус —
covered, observe, gap или
attested — и сколько раз он реально сработал за период. Контроль MANAGE
2.1, который флагировал 2000 попыток инъекций, читается для ревьюера иначе,
чем тот, у которого ноль совпадений, и отчёт показывает оба.Происхождение
Происхождение
Каждый материализованный контроль записывает свой
control_id (например,
nistai.injection), дословную клаузу (NIST AI RMF MANAGE 2.1),
плоскость и id живого guardrail, применяющего его — так что ревьюер
проходит функция → контроль → применяющая политика → совпадения, без
выведенного догадкой шага.Публичная проверка
Публичная проверка
Получите подписывающий публичный ключ на
GET /api/public/compliance/pubkey,
отправьте отчёт на POST /api/public/compliance/verify или откройте
скоупнутую ссылку-шеринг для ревьюера на
GET /api/public/compliance/share/:token. Аккаунт не требуется.4. Проштампуйте регионом ваши доказательства NIST AI RMF
Отчёты проштампованы и хранятся под вашим заявленным регионом резидентности данных (us / eu / uk / ap / cn / global); отчёт
отдаётся только под совпадающим регионом, а межрегиональные чтения
удерживаются. Admin рабочего пространства устанавливает его через
PUT /api/compliance/residency.
Логи запросов по умолчанию удерживаются 30 дней (ограничено сервером до
180-дневного жёсткого максимума), а удаление пользователя запускает 30-дневное
льготное окно, затем вычистку PII — оба релевантны, когда ревьюер спрашивает о
вашей позиции удержания. См.
Удержание и
Право на удаление.
5. NIST AI RMF рядом с остальной частью вашей программы
AI RMF редко приходит один. Тот же процесс установки покрывает смежные фреймворки AI-управления и безопасности LLM, каждый материализует свои собственные редактируемые контроли:| Пакет | Фреймворк |
|---|---|
iso_42001 | Система управления ИИ ISO/IEC 42001 |
eu_ai_act | Закон ЕС об искусственном интеллекте |
owasp_llm | OWASP Top 10 для приложений LLM |
ISO 42001
Доказательства системы управления ИИ.
EU AI Act
Запрещённые практики, прозрачность, ведение записей.
OWASP LLM Top 10
Высокосигнальные риски безопасности LLM как пакет.
6. Куда дальше
Установка пакета
Полная механика установки, разделяемая всеми фреймворками.
Наблюдение vs применение
Как режим наблюдения превращается в живое применение, осознанно.
Справочник Guardrails
Контроли content-плоскости, из которых построен пакет NIST AI RMF.
Prompt injection
Угроза, от которой защищает контроль MANAGE 2.1.
