Biblioteka szablonów guardrail ai OrcaRouter: wybierz preset z kategorii PII, secrets, compliance, brand, safety, cost lub agent, zastosuj go jako ziarno, potem edytuj każdą regułę swobodnie, zanim powiążesz klucz.
Chcesz mieć politykę treści na miejscu szybko, bez ręcznego pisania regexów
czy list encji PII. Biblioteka szablonów to skrót: zestaw gotowych
presetów guardrail, pogrupowanych po przypadku użycia, z których każdy zasiewa
działającą politykę jednym kliknięciem. Wybierz jeden, nazwij go, a masz
kompletny uporządkowany zestaw reguł, który możesz powiązać z kluczem — lub
najpierw zedytować.To skupiona strona docelowa dla przypadku presetów. Po pełny silnik guardrail
— każdy typ reguły, pole, akcję i trasę — zobacz
referencję Guardrails.
Preset to nazwany punkt wyjścia, który wrzuca kompletny Policy (jedną
lub więcej uporządkowanych reguł) do modalu tworzenia. Presety są autorowane
po stronie serwera, więc wybór w konsoli,
piaskownica Test i te dokumenty
opisują dokładnie to samo zachowanie — jest jedno źródło prawdy.Każdy preset to ziarno, nie blokada. Gdy zastosujesz jeden, posiadasz
kopię: zmień nazwę, dodaj lub usuń reguły, zmień
akcję lub
etap reguły, dostrój detektor. Nic w
oryginalnym szablonie nie ogranicza twoich edycji.
Zastosowanie presetu, jak całe autorowanie guardrail, to akcja konsoli pod
twoją własną sesją przestrzeni roboczej, a utworzenie lub edycja guardrail
wymaga Developer+ w przestrzeni roboczej. Tylko końcowe wywołanie relay
/v1/* używa klucza sk-orca-....
Wybór grupuje presety w osiem kategorii. Każda mapuje się na typową kontrolę,
którą inaczej budowałbyś ręcznie:
PII — redaguj lub blokuj dane osobowe
Wykrywaj i maskuj (lub blokuj) emaile, telefony, SSN, karty, IP i więcej.
Zacznij od PII Shield po
jednoregułowe maskowanie lub restrykcyjny bloker, gdy PII nigdy nie może
dotrzeć do dostawcy.
Secrets — trzymaj poświadczenia z dala od promptów
Blokuj klucze AWS / OpenAI / GitHub, klucze prywatne PEM, tokeny chmurowe
i adresy portfeli krypto, zanim opuszczą bramę. Zobacz
Blokuj sekrety.
Compliance — szyny danych regulowanych
Blokady kart PCI, blokady identyfikatorów EU/UK, blokady identyfikatorów
zdrowotnych i tylko-obserwacja
rejestrator zgodności, który
rejestruje wystąpienia PII bez zmiany ruchu.
Brand — listy zakazanych i bezpieczeństwo marki
Listy zakazanych słów kluczowych dla wulgaryzmów, wzmianek o konkurencji i
terminów zakazanych specyficznych dla regionu — block lub mask. Zobacz
Bezpieczeństwo marki i
Słowa wrażliwe.
Safety — injection, jailbreak, samookaleczenie
Szyny keyword/regex dla fraz prompt-injection, wzorców jailbreak /
role-play, wykrywania wycieku system-promptu i list zakazanych
samookaleczenia. Zobacz
Prompt injection.
Cost — limity rozmiaru i długości
Limity max_chars na promptie żądania i odpowiedzi modelu, by ograniczyć
koszt i latencję. Zobacz
Guardrails kosztów.
Agent — agentowe filtry treści
Filtry URL, blokady markdown-image (obrona przed eksfiltracją obrazów),
wzorce shell-injection i filtry SQL-injection-in-output dla przepływów
agenta. Zobacz
Guardrails agentowe.
Code security — sekrety, licencje, ryzykowne API
Blokady przypisań plików .env / sekretów, flagi licencji silnego
copyleft (GPL / AGPL / LGPL / SSPL) na żądaniach i wyjściu modelu oraz
nieblokujące ostrzeżenie, które adnotuje prompty odwołujące się do wysoce
ryzykownych sinków (eval, os.system, pickle.loads). Zobacz
Bezpieczeństwo kodu.
Presety zasiewają tylko deterministyczne typy reguł — keyword, regex, PII
i max-chars. Zaawansowane typy reguł (zewnętrzny dostawca,
sędzia LLM, kontekstowe ugruntowanie) są
dodawane z konstruktora reguł, nie z szablonu, bo potrzebują połączenia lub
modelu, który wybierzesz.
Każdy krok tutaj to akcja konsoli. Klucz relay pojawia się tylko w końcowym
żądaniu.
1
Otwórz wybór szablonów
W konsoli otwórz Guardrails i kliknij przycisk z podziałem New
guardrail. Wybór otwiera się pogrupowany po ośmiu kategoriach powyżej.
2
Wybierz preset
Wybierz jeden — np. PII Shield z kategorii PII. Zasiewa kompletną
politykę (tu pojedynczą maskującą regułę pii). Wybór pokazuje opis
każdego presetu, byś wiedział, co robi, zanim go zastosujesz.
3
Nazwij go i edytuj swobodnie
Nadaj mu nazwę (≤ 64 znaki). Zasiane reguły są teraz twoje — dodawaj,
usuwaj lub dostrajaj którąkolwiek z nich. Preset to ziarno, nie blokada.
4
Przetestuj, zanim powiążesz
Otwórz zakładkę Test, wklej próbkę, wybierz etap i uruchom politykę
lokalnie — bez wywołania w górę, bez kwoty. Udowodnij, że robi to, czego
oczekujesz, zanim jakikolwiek klucz na nią wskaże.
5
Powiąż klucz
Edytuj klucz API i wybierz guardrail z rozwijanej listy Guardrail
(ustawia guardrail_id na kluczu) lub oznacz go jako domyślny
przestrzeni roboczej. Zobacz
Powiąż z kluczem i
Domyślny dla konta.
To użyteczna polityka maskowania od razu. Ale ponieważ preset to ziarno,
możesz natychmiast ją zacieśnić — na przykład przełączyć dwie encje na
block przez nadpisanie per-encja, by karty i SSN były odrzucane wprost,
podczas gdy reszta jest maskowana:
Brama maskuje email do [EMAIL] przed przesłaniem. Żądanie niosące numer
karty jest odrzucane z HTTP 400guardrail_blocked — co nie kosztuje
kwoty (blokada wejścia działa przed pomiarem) i jest oznaczone jako
skip-retry. Zobacz
błąd guardrail_blocked.
Preset PII Shield zasiewa regułę maskowania na etapie both, ale żywe
maskowanie wyjścia modelu i odpowiedzi strumieniowanych jest w planach —
maskowanie na etapie wejścia to ścieżka żywa (brama czyści żądanie, zanim
model je zobaczy). Aby bramkować odpowiedzi modelu już dziś, reguła block
wyjścia jest egzekwowana zarówno streaming, jak i nie-streaming. Zobacz
Reguły na etapie wyjścia i
Pokrycie streamingu.
Każde utworzenie, aktualizacja i usunięcie na guardrail — w tym moment, gdy
zastosujesz preset i zapiszesz — zapisuje wersjonowany wiersz historii. Możesz
porównać dowolne dwie wersje i przywrócić wcześniejszą, więc edycja
zasianej polityki nigdy nie jest drzwiami jednokierunkowymi. Zobacz
Wersjonowanie.
Preset maskowania PII jednym kliknięciem, od początku do końca.
Blokuj sekrety
Preset Secrets Blocker — wychwyć klucze i poświadczenia w żądaniu.
Guardrails agentowe
Filtry URL, markdown-image, shell i SQL dla przepływów agenta.
Referencja Guardrails
Kompletny silnik — każdy typ reguły, pole i trasa.
Presety zasiewają polityki treści. Aby rządzić wywołaniami narzędzi
agenta — odmawiać akcji destrukcyjnych, redagować argumenty wywołań narzędzi,
wymagać zatwierdzenia — zacznij od Firewalla i
Zabezpieczania agentów AI. Jak obie
warstwy dzielą pracę, zobacz
Guardrails vs. Firewall.