1. Polityka bezpieczeństwa per klucz: dwa pola na kluczu
Guardrail prześwietla tekst, który płynie przez model (PII, sekrety, jailbreaki). Polityka firewalla rządzi wywołaniami narzędzi, które agent wystawia (które narzędzia, które serwery MCP, które hosty). Oba są nazwanymi politykami w zakresie przestrzeni roboczej — stworzonymi raz, współdzielonymi w przestrzeni roboczej — a klucz wybiera konkretną przez dwa pola:| Pole | Wiąże | Ustawiane w konsoli |
|---|---|---|
guardrail_id | Guardrail, który prześwietla prompty i odpowiedzi tego klucza. | Developer+ |
firewall_policy_id | Polityka firewalla, która ocenia wywołania narzędzi tego klucza. | Developer+ |
/console/token. Ustawienie
któregokolwiek to akcja Developer+ — same polityki są również tworzone
jako Developer+ (zobacz
Zakres i klucze).
Te dwa pola są niezależne. Klucz może dołączyć guardrail i nie dołączyć
polityki firewalla, na odwrót, oba lub żadnego — każda płaszczyzna rozwiązuje
się sama. Pozostawienie pola nieustawionego (
0) to nie to samo, co
wyłączenie egzekwowania; zobacz
§3.2. Jeden konkretny przykład
Powiedzmy, że domyślny guardrail twojej przestrzeni roboczej flaguje PII, ale przepuszcza je, a domyślna polityka firewalla audytuje każde wywołanie narzędzia. To w porządku dla większości agentów — ale twój agent finansowy obsługuje numery SSN klientów i nigdy nie powinien wywoływać narzędzia shell. Stwórz ściślejszyfinance-guardrail (blokuje PII wprost) i
finance-firewall (lista dozwolonych tylko z trzema potrzebnymi
narzędziami), a potem powiąż oba z kluczem tego agenta:
12, a jego wywołania narzędzi oceniane przez politykę 8 — podczas gdy
każdy inny klucz w przestrzeni roboczej dalej uruchamia domyślne przestrzeni
roboczej. Własny kod agenta nigdy się nie zmienia; dalej wywołuje
https://api.orcarouter.ai/v1/... swoim kluczem sk-orca-… dokładnie jak
wcześniej.
3. Rozwiązywanie: reguła, która łapie ludzi
Dla każdego żądania brama rozwiązuje aktywny guardrail i aktywną politykę firewalla niezależnie. Kolejność wygląda tak samo dla obu — najpierw załącznik, potem domyślne przestrzeni roboczej — ale rozchodzą się w jednym przypadku.Rozwiązywanie guardrailu
Dołączony i włączony → użyj go
Dołączony i włączony → użyj go
guardrail_id klucza wskazuje na guardrail, który istnieje i jest
włączony. Ten guardrail prześwietla żądanie.Dołączony, ale WYŁĄCZONY lub usunięty → brak guardrailu
Dołączony, ale WYŁĄCZONY lub usunięty → brak guardrailu
Wyłączenie dołączonego guardrailu jest przełącznikiem wyłączającym.
Klucz nie dostaje żadnego prześwietlania treści — nie wraca do
domyślnego przestrzeni roboczej. To celowe: dołączenie guardrailu i
wyłączenie go to sposób, by wyłączyć prześwietlanie dla tego klucza.
Nieustawiony (0) → domyślny przestrzeni roboczej
Nieustawiony (0) → domyślny przestrzeni roboczej
Brak
guardrail_id na kluczu. Stosuje się włączony domyślny guardrail
przestrzeni roboczej, jeśli jakiś jest ustawiony.Żadne → brak egzekwowania
Żadne → brak egzekwowania
Brak załącznika i brak domyślnego przestrzeni roboczej → żądanie
przechodzi bez prześwietlania treści.
Rozwiązywanie firewalla
Dołączona i włączona → użyj jej
Dołączona i włączona → użyj jej
firewall_policy_id klucza wskazuje na politykę, która istnieje i jest
włączona. Ta polityka ocenia wywołania narzędzi klucza.Dołączona, ale WYŁĄCZONA → domyślna przestrzeni roboczej
Dołączona, ale WYŁĄCZONA → domyślna przestrzeni roboczej
Tu jest różnica. Wyłączony załącznik firewalla wraca do domyślnej
polityki firewalla przestrzeni roboczej — nie wyłącza egzekwowania.
Wyłączenie załącznika firewalla cofa klucz do domyślnej przestrzeni
roboczej; nie pozostawia klucza bez ochrony.
Nieustawiona (0) → domyślna przestrzeni roboczej
Nieustawiona (0) → domyślna przestrzeni roboczej
Brak
firewall_policy_id na kluczu → stosuje się włączona domyślna
polityka firewalla przestrzeni roboczej.4. Jak wygląda block
Gdy powiązana polityka odmawia żądania, wywołujący widzi ustrukturyzowany błąd — agent może zareagować zamiast się wysypać:| Płaszczyzna | Kod błędu | HTTP | Koszt |
|---|---|---|---|
| Guardrail | guardrail_blocked | 400 | Brak — block wejścia odpala przed pomiarem; block wyjścia zwraca koszt. Oznaczony skip-retry. |
| Firewall (inbound) | firewall_blocked | 400 | Block inbound odpala przed wywołaniem modelu, więc bez tokenów modelu. Skip-retry. |
| Firewall (wstrzymane) | firewall_approval_pending | 400 | Wstrzymane do zatwierdzenia przez człowieka; agent odpytuje i ponownie wysyła po zatwierdzeniu. |
5. Dokąd dalej
Zakres i klucze
Pełny trójpoziomowy model — przestrzeń robocza, polityka, klucz — i każde
pole, które niesie klucz.
Obiekt tokenu
Każde pole na kluczu:
model_limits, allow_ips, credit_limit_usd,
expired_time oraz dwa załączniki polityk.Guardrails
Stwórz politykę treści, którą wiążesz przez
guardrail_id — reguły,
encje PII, akcje i presety.Firewall
Stwórz politykę wywołań narzędzi, którą wiążesz przez
firewall_policy_id — werdykty, powierzchnie i poziomy autonomii.Chcesz ustawić całą postawę przestrzeni roboczej jednym ruchem zamiast wiązać
klucze pojedynczo? Poziom autonomii zapisuje obie płaszczyzny —
guardrails i firewall — naraz. Potem dołącz ściślejsze polityki na tych kilku
kluczach, które muszą pójść dalej niż domyślne przestrzeni roboczej. Zobacz
Guardrails vs Firewall.
