1. Trzy postawy na pierwszy rzut oka
| Postawa | Co się dzieje z ruchem | Mechanizm | Kiedy używać |
|---|---|---|---|
| Obserwacja | Cały ruch jest dozwolony; wywołania bez polityki są logowane jako luki w pokryciu | Workspace-level tryb obserwacji włączony; reguły guardrail używają akcji flag; default_verdict firewalla to audit | Odkrywanie bazowej linii — rozumienie, co twoje agenty faktycznie robią, zanim napiszesz jedną regułę |
| Cień | Ruch jest dozwolony; polityka ewaluuje i potencjalne blokady są logowane jako [shadow] would … | Flaga shadow_mode per polityka na polityce firewalla | Bezpieczna walidacja przed produkcją — potwierdzaj, że polityka odpala poprawnie, zanim dotknie ruchu |
| Egzekwowanie | Rzeczywiste werdykty obowiązują — deny blokuje, sanitize redaguje, pending_approval wstrzymuje | Shadow mode wyłączony; akcje reguł guardrail ustawione na block / mask; werdykty firewalla są aktywne | Egzekwowanie produkcyjne po weryfikacji polityki w cieniu |
Wymaganie roli. Każdy członek przestrzeni roboczej może czytać polityki,
ustawienia i widok odkrytych narzędzi; strumienie Events i Runs
firewalla wymagają roli Developer. Zmiana ustawień, akcji polityki lub
shadow_mode również wymaga Developer lub wyższej.2. Postawa obserwacji — mierz, zanim zaczniesz rządzić
Postawa obserwacji to nie jeden przełącznik. To kombinacja trzech niezależnych mechanizmów, które razem produkują „zezwalaj na wszystko, rejestruj wszystko”:Tryb obserwacji firewalla (ustawienie przestrzeni roboczej)
Gdy wywołanie narzędzia rozwiązuje się do żadnej polityki w ogóle — brak dołączenia klucza i brak domyślnego przestrzeni roboczej — workspace-level tryb obserwacji firewalla określa, co się dzieje:- Tryb obserwacji włączony: wywołanie jest dozwolone i logowane jako luka w pokryciu. Widok Discovered Tools wypełnia się z tych zdarzeń luk, pokazując dokładnie, które narzędzia twoje agenty uruchamiają bez żadnej reguły, która je obejmuje.
- Tryb obserwacji wyłączony: wywołanie jest dozwolone po cichu — bajt-identycznie z przestrzenią roboczą, która nigdy nie włączyła tej funkcji.
Werdykt audit firewalla (domyślny per polityka)
Gdy polityka się rozwiązuje, ale żadna reguła nie pasuje do wywołania
narzędzia, obowiązuje default_verdict polityki. Domyślna wartość
default_verdict to audit — zezwól na wywołanie i zapisz je do
przeglądu. Nowa polityka bez reguł i bez zmian konfiguracji nie blokuje
niczego i po cichu nie zezwala na nic: audytuje wszystko, co widzi.
audit jest też normalnym werdyktem reguły. Reguła, która pasuje i produkuje
audit, przepuszcza wywołanie i rejestruje je — odpowiednik trybu audytu
guardrail dla firewalla.
Akcja flag guardrail (akcja reguły per reguła)
Po stronie guardrails, akcja flag jest odpowiednikiem obserwacji: reguła
odpala, dopasowanie jest rejestrowane w strumieniu Matches, a żądanie
kontynuuje bez zmian. Bez blokady. Bez redagowania. Używaj flag, gdy
chcesz zmierzyć regułę — zobaczyć, jak często odpala i na czym — zanim
zobowiążesz się do block lub mask.
Razem te trzy produkują postawę obserwacji: tryb obserwacji wychwytuje nieobsłużone wywołania narzędzi; werdykty
audit obejmują wywołania narzędzi
pod polityką, ale jeszcze nie pod konkretną regułą; akcje flag obejmują
sprawdzenia guardrail, na których egzekwowanie nie jesteś jeszcze gotowy.
3. Postawa cienia — waliduj przed egzekwowaniem
Tryb cienia to flaga per polityka (shadow_mode: true) na polityce
firewalla. Gdy jest włączony:
- Polityka ewaluuje każde wywołanie narzędzia dokładnie tak jak na produkcji — reguły są dopasowywane, werdykty są obliczane, predykaty argumentów są testowane.
- Każdy egzekwujący werdykt (
deny,sanitize,pending_approval) jest degradowany doauditzanim dotrze do narzędzia. - Zalogowany powód jest poprzedzony przedrostkiem
[shadow] would …, abyś mógł zobaczyć w strumieniu zdarzeń dokładnie, co by zostało zablokowane, zredagowane lub wstrzymane.
Guardrails nie mają odpowiednika
shadow_mode na poziomie polityki —
używaj akcji flag per reguła, aby obserwować poszczególne sprawdzenia
guardrail przed przełączeniem na block lub mask.4. Postawa egzekwowania — rzeczywiste werdykty, rzeczywiste konsekwencje
W postawie egzekwowania nic nie jest degradowane:- Firewall
deny→ agent widzi błąd narzędzia (MCP) lub HTTP 400firewall_blocked(powierzchnia inbound). Błąd nazywa narzędzie i powód. Oznaczony skip-retry. - Firewall
sanitize→ dopasowane podłańcuchy są redagowane z argumentów narzędzia i oczyszczone wywołanie jest przekazywane dalej. - Firewall
pending_approval→ wywołanie jest wstrzymane; agent otrzymuje HTTP 400firewall_approval_pendingi id zatwierdzenia do odpytywania. - Guardrail
block→ HTTP 400guardrail_blocked, nazywając guardrail i regułę, która odpaliła. Nie kosztuje limitu. - Guardrail
mask→ dopasowanie jest redagowane (np.jane@acme.com→[EMAIL]) i żądanie kontynuuje z oczyszczonym tekstem.
shadow_mode na polityce
firewalla i zmień akcje reguł guardrail z flag na block lub mask
odpowiednio.
5. Rekomendowane wdrożenie
Obserwacja — odkryj, co robią twoje agenty
Włącz workspace tryb obserwacji (
PUT /api/workspace/firewall/settings, firewall_observe_mode: true).
Pozostaw firewall bez polityki (lub z polityką, której default_verdict
to audit). Dodaj akcje flag do reguł guardrail, które chcesz zmierzyć.Obserwuj, jak widok Discovered Tools wypełnia się każdym wywołaniem
narzędzia, które twoje agenty wykonują, oznaczonym covered lub gap.
Użyj tego jako danych wejściowych do pisania pierwszych reguł polityki —
piszesz reguły dla rzeczywistego ruchu, nie hipotetycznego.Pozwól temu działać, aż widok Discovered Tools ustabilizuje się i będziesz
mieć wystarczająco dużo danych do pisania celowych reguł.Cień — waliduj przed egzekwowaniem
Napisz politykę firewalla z
shadow_mode: true. Dołącz ją do kluczy,
które chcesz zarządzać (lub ustaw jako domyślną przestrzeni roboczej).
Dla guardrails, na tym etapie trzymaj akcje reguł jako flag.Polityka teraz ewaluuje każde rzeczywiste wywołanie narzędzia i loguje,
co by zrobiła. Otwórz widoki Events i Runs i filtruj według
przedrostka [shadow]. Potwierdź:- Odpala na narzędziach i wzorcach argumentów, które zamierzałeś.
- Nie odpala na niczym, co chcesz zezwolić (fałszywie pozytywne).
Egzekwowanie — przełącz
Ustaw
shadow_mode: false na polityce. Dla reguł guardrail, które
obserwowałeś z flag, zmień akcję na block lub mask odpowiednio.Monitoruj strumień Events pod kątem nieoczekiwanych blokad w
pierwszej godzinie. Akcja Cofnij w logu audytu autonomii pozwala
przywrócić poprzedni stan jednym kliknięciem, jeśli potrzebujesz
wycofać się.6. Poziomy autonomii — ustaw to wszystko naraz
Dostrajanie polityk reguła po regule to precyzyjna ścieżka. Poziomy autonomii to ta szybka — jeden przełącznik, który atomowo ustawia postawę Firewall i Guardrails twojej przestrzeni roboczej w jednej transakcji, z jednym kliknięciem cofnięcia:| Poziom | Produkowana postawa |
|---|---|
permissive | Postawa obserwacji: brak egzekwującej polityki, brak guardrails, workspace tryb obserwacji włączony — widzisz wszystko, nic nie jest blokowane. Mapuje na krok Obserwacja powyżej. |
balanced | Domyślny werdykt audit, ale destrukcyjny shell jest odmówiony; PII Shield działa w trybie tylko audytu (flaguje PII); tryb obserwacji wyłączony. Rekomendowana postawa startowa, gdy znasz kształt swojego ruchu. |
tight | Pełne egzekwowanie: domyślna odmowa, z destrukcyjnym shellem i egress SSRF odmówionymi; guardrails PII Shield + Secrets Blocker egzekwowane (sprawdzają żądania pod kątem PII i sekretów); tryb obserwacji wyłączony. |
POST /api/workspace/firewall/autonomy (Developer+). Endpoint
Simulate (GET /api/workspace/firewall/simulate?level=) podgląda, co
zmiana poziomu by zrobiła, zanim ją zastosujesz.
Poziomy autonomii to warstwa wygody nad tymi samymi mechanizmami opisanymi
powyżej — ustawiają
default_verdict, tryb obserwacji, reguły firewalla
i akcje reguł guardrail. Nie przełączają shadow_mode; to pozostaje
ręczną kontrolą per polityka. Zawsze możesz nadpisać poszczególne ustawienia
po zastosowaniu poziomu.7. Mapa mechanizmów — które ustawienie co robi
Ta tabela to autorytatywna referencja. Cztery terminy są odrębne — nie mylić ich:| Termin | Rodzaj | Co kontroluje |
|---|---|---|
| Tryb obserwacji | Ustawienie przestrzeni roboczej | Zachowanie, gdy wywołanie narzędzia rozwiązuje się do żadnej polityki. Włączony → loguj jako luka (Discovered Tools). Wyłączony → ciche zezwolenie. |
Werdykt audit | Werdykt polityki / reguły | Zachowanie dla wywołania narzędzia pod polityką, która pasuje (lub spada do domyślnego). Zezwól + zapisz. Domyślny default_verdict. |
Akcja flag | Akcja reguły guardrail | Sprawdzenie guardrail zezwala na ruch i rejestruje dopasowanie. Akcja obserwacji-bez-egzekwowania dla guardrails. |
shadow_mode | Flaga per polityka firewalla | Degraduj wszystkie egzekwujące werdykty (deny/sanitize/pending_approval) do audit i poprzedzaj powód przedrostkiem [shadow] would …. |
Baza Secure Agents
Rekomendowana postawa startowa i pięciominutowa konfiguracja dla
bezpieczeństwa agentów zero trust.
Agent Firewall
Pełna referencja dla polityk, reguł, werdyktów, trybu cienia i
bramy MCP.
