Guardrails vs. Agent Firewall — когда что использовать
guardrails vs firewall: различие в одной строке, сравнение бок о бок и сопоставление угроз и слоёв, чтобы помочь определить, какая плоскость безопасности OrcaRouter перехватывает каждый риск.
Краткий ответ: Guardrails управляют текстом; Firewall управляет действиями.
Они дополняют друг друга — через оба проходит один запрос — и самый быстрый
способ настроить их вместе — это уровень автономии.Остальная часть этой страницы для случаев, когда нужно знать, какой слой
владеет конкретной угрозой.
Требуемая роль. Любой участник рабочего пространства может читать политики
и ленту Matches guardrail; лента Events firewall требует роли Developer.
Создание или редактирование guardrails или политик firewall также требует
Developer или выше.
Вызовы инструментов, диспетч MCP, исходящие сетевые адреса назначения
Guardrails срабатывают до вышестоящего вызова (на промпте) и после него (на
ответе). Firewall срабатывает на каждом вызове инструмента, который выпускает
модель или инициирует агент — независимо от модели или провайдера, обслужившего
ход.
4. Используйте оба — уровни автономии настраивают их вместе
Guardrails и Firewall разработаны для компоновки, а не конкуренции. Один запрос
проходит через обе плоскости:
Входной guardrail работает — текст промпта проверяется и опционально маскируется.
Вызов модели — (возможно очищенный) промпт достигает вышестоящей модели.
Firewall — каждый вызов инструмента, выпускаемый моделью, оценивается.
Выходной guardrail работает — текст ответа модели проверяется.
Самый быстрый способ настроить оба сразу — уровень автономии — одна настройка,
которая атомарно записывает политику Firewall и политику Guardrails для всего
рабочего пространства с отменой в один клик: