Guardrails vs. Agent Firewall — kiedy używać którego
guardrails vs firewall: jednostronicowe rozróżnienie, porównanie obok siebie i mapowanie zagrożenie-do-warstwy, które pomaga zdecydować, która płaszczyzna bezpieczeństwa OrcaRouter wychwytuje każde ryzyko.
Krótka odpowiedź: Guardrails zarządzają tekstem; Firewall zarządza akcjami.
Są uzupełniające — jedno żądanie przepływa przez obie — a najszybszym sposobem
na wspólną konfigurację jest poziom autonomii.Reszta tej strony jest dla przypadków, gdy musisz wiedzieć, która warstwa
odpowiada za konkretne zagrożenie.
Wymagana rola. Każdy członek przestrzeni roboczej może czytać polityki
i strumień Matches guardrail; strumień Events firewalla wymaga roli
Developer. Tworzenie lub edycja guardrails lub polityk firewalla wymaga
też Developer lub wyższej.
Wywołania narzędzi, dyspozycje MCP, zewnętrzne miejsca docelowe w sieci
Guardrails odpalają przed wywołaniem nadrzędnym (na prompcie) i po nim (na
odpowiedzi). Firewall odpala przy każdym wywołaniu narzędzia, które model
emituje lub które agent wydaje — niezależnie od modelu lub dostawcy, który
obsłużył turę.
4. Używaj obu — poziomy autonomii ustawiają je razem
Guardrails i Firewall są zaprojektowane do komponowania, a nie konkurowania.
Jedno żądanie przechodzi przez obie płaszczyzny:
Guardrail wejściowy działa — tekst promptu jest sprawdzany i
opcjonalnie maskowany.
Wywołanie modelu — (możliwie zredagowany) prompt dociera do modelu
nadrzędnego.
Firewall — każde wywołanie narzędzia emitowane przez model jest
ewaluowane.
Guardrail wyjściowy działa — tekst odpowiedzi modelu jest sprawdzany.
Najszybszym sposobem na konfigurację obu naraz jest poziom autonomii —
jedno ustawienie, które atomowo zapisuje politykę Firewall i politykę
Guardrails dla całej przestrzeni roboczej, z jednym kliknięciem cofnięcia:
Brak egzekwujących reguł; tryb obserwacji włączony
Brak egzekwowania
Zastosuj poziom autonomii z konsoli Firewall (POST /api/workspace/firewall/autonomy,
Developer+), a potem niezależnie dostrajaj każdą płaszczyznę stamtąd.
Guardrails mają tekst; Firewall ma akcje — uruchom obie, pozwól poziomowi
autonomii je spiąć razem i zaostrzaj każdą płaszczyznę niezależnie, gdy
widzisz rzeczywisty ruch swoich agentów.
Guardrails
Typy reguł, wykrywanie PII, sędzia LLM, harness ewaluacyjny i
referencja API.
Agent Firewall
Werdykty, powierzchnie, poziomy autonomii, zatwierdzenie HITL i
referencja API.