Библиотека шаблонов ai guardrail OrcaRouter: выберите пресет из категории PII, secrets, compliance, brand, safety, cost или agent, примените его как семя, затем редактируйте каждое правило свободно перед привязкой ключа.
Вы хотите контентную политику на месте быстро, не выписывая regex’ы или
списки сущностей PII вручную. Библиотека шаблонов — это сокращение:
набор готовых пресетов guardrail, сгруппированных по сценариям, каждый из
которых засевает рабочую политику в один клик. Выберите один, назовите
его, и у вас есть полный упорядоченный набор правил, который можно
привязать к ключу — или сначала отредактировать.Это сфокусированная посадочная страница для сценария пресетов. Полный
движок guardrail — каждый тип правила, поле, действие и маршрут — см. в
справочнике Guardrails.
Пресет — это именованная отправная точка, которая бросает полную
Policy (одно или несколько упорядоченных правил) в модальное окно
создания. Пресеты создаются на стороне сервера, так что выборщик консоли,
песочница Test и эта документация
все описывают ровно одно и то же поведение — есть один источник истины.Каждый пресет — это семя, а не замок. Как только вы применяете один,
копия — ваша: переименуйте её, добавьте или удалите правила, измените
действие или
стадию правила, перенастройте
детектор. Ничто в оригинальном шаблоне не ограничивает ваши правки.
Применение пресета, как и всё создание guardrails, — действие консоли
под вашей собственной сессией рабочего пространства, и создание или
редактирование guardrail требует Developer+ в рабочем пространстве.
Только финальный relay-вызов /v1/* использует ключ sk-orca-....
Выборщик группирует пресеты в восемь категорий. Каждая отображается на
распространённый контроль, который вы иначе строили бы вручную:
PII — редактируйте или блокируйте персональные данные
Детектируйте и маскируйте (или блокируйте) emails, телефоны, SSN,
карты, IP и другое. Начните с
PII Shield для маскирования в
одно правило или строгого блокировщика, когда PII никогда не должна
дойти до провайдера.
Secrets — держите учётные данные вне промптов
Блокируйте ключи AWS / OpenAI / GitHub, приватные ключи PEM, облачные
токены и адреса криптокошельков до того, как они покинут шлюз. См.
Блокировку секретов.
Compliance — рельсы регулируемых данных
Блокировки карт PCI, блокировки идентификаторов EU/UK, блокировки
идентификаторов здравоохранения и
логгер соответствия только
для наблюдения, который записывает вхождения PII, не меняя трафик.
Brand — denylist'ы и защита бренда
Keyword-denylist’ы для ненормативной лексики, упоминаний конкурентов и
регион-специфичных запрещённых терминов — block или mask. См.
Защиту бренда и
Чувствительные слова.
Safety — инъекция, jailbreak, self-harm
Рельсы keyword/regex для фраз prompt-инъекции, паттернов jailbreak /
role-play, детекции утечки системного промпта и denylist’ов self-harm.
См. Prompt injection.
Cost — лимиты размера и длины
Лимиты max_chars на промпт запроса и ответ модели для ограничения
стоимости и задержки. См.
Cost guardrails.
Agent — агентные контентные фильтры
Фильтры URL, блокировки markdown-изображений (защита от
image-эксфильтрации), паттерны shell-инъекции и фильтры
SQL-инъекции-в-выводе для агентных потоков. См.
Агентные guardrails.
Code security — секреты, лицензии, рискованные API
Блокировки присваивания .env / файлов секретов, флаги лицензий
сильного copyleft (GPL / AGPL / LGPL / SSPL) на запросах и выводе
модели и неблокирующее уведомление, которое аннотирует промпты,
ссылающиеся на высокорисковые стоки (eval, os.system,
pickle.loads). См.
Безопасность кода.
Пресеты засевают только детерминированные типы правил — keyword,
regex, PII и max-chars. Продвинутые типы правил (внешний вендор,
LLM judge, контекстная
заземлённость) добавляются из конструктора правил, а не из шаблона, потому
что им нужно подключение или модель, которую вы выбираете.
Каждый шаг здесь — действие консоли. Relay-ключ появляется только в
финальном запросе.
1
Откройте выборщик шаблонов
В консоли откройте Guardrails и нажмите split-кнопку New
guardrail. Выборщик открывается сгруппированным по восьми категориям
выше.
2
Выберите пресет
Выберите один — например, PII Shield из категории PII. Он
засевает полную политику (здесь — единственное маскирующее правило
pii). Выборщик показывает описание каждого пресета, так что вы
знаете, что он делает, прежде чем применить его.
3
Назовите и редактируйте свободно
Дайте ему имя (≤ 64 символов). Засеянные правила теперь ваши —
добавляйте, удаляйте или перенастраивайте любое из них. Пресет — это
семя, а не замок.
4
Протестируйте перед привязкой
Откройте вкладку Test, вставьте образец, выберите стадию и
прогоните политику локально — без вышестоящего вызова, без квоты.
Докажите, что она делает то, что вы ожидаете, прежде чем на неё укажет
любой ключ.
5
Привяжите ключ
Отредактируйте API-ключ и выберите guardrail из выпадающего списка
Guardrail (устанавливает guardrail_id на ключе) или пометьте его
default’ом рабочего пространства. См.
Привязку к ключу и
Default аккаунта.
Это пригодная маскирующая политика «из коробки». Но поскольку пресет —
семя, вы можете немедленно её ужесточить — например, переключить две
сущности на block через переопределение по сущности, чтобы карты и
SSN отклонялись целиком, тогда как остальные маскируются:
Шлюз маскирует email в [EMAIL] перед пересылкой. Запрос, несущий номер
карты, отклоняется с HTTP 400guardrail_blocked — что не стоит
квоты (блокировка input срабатывает до тарификации) и помечается
skip-retry. См.
ошибку guardrail_blocked.
Пресет PII Shield засевает маскирующее правило стадии both, но
живое маскирование вывода модели и стримированных ответов в дорожной
карте — маскирование на стадии input — живой путь (шлюз очищает
запрос до того, как модель его увидит). Чтобы шлюзовать ответы модели
сегодня, правило output block применяется и на стриминге, и на
нестриминге. См.
Правила стадии output и
Покрытие стриминга.
Каждое создание, обновление и удаление guardrail — включая момент, когда
вы применяете пресет и сохраняете — пишет версионированную строку истории.
Вы можете сравнить любые две версии и откатиться к более ранней,
так что редактирование засеянной политики никогда не дверь в одну сторону.
См. Версионирование.
Пресет маскирования PII в один клик, от начала до конца.
Блокировка секретов
Пресет Secrets Blocker — ловите ключи и учётные данные в запросе.
Агентные guardrails
Фильтры URL, markdown-изображений, shell и SQL для агентных потоков.
Справочник Guardrails
Полный движок — каждый тип правила, поле и маршрут.
Пресеты засевают контентные политики. Чтобы управлять вызовами
инструментов агента — запрещать деструктивные действия, редактировать
аргументы вызовов инструментов, требовать подтверждения — начните с
Firewall и
Защиты ИИ-агентов. О том, как
два слоя делят работу, см.
Guardrails vs. Firewall.