1. Dlaczego brama jest właściwym punktem inspekcji
Większość kontroli bezpieczeństwa żyje w aplikacji: opakowania bibliotek, hooki frameworków agentów, SDK per-dostawca. Te kontrole mają fatalną strukturalną wadę — psują się, gdy tylko dodasz drugiego dostawcę, zmienisz framework lub pozwolisz agentowi samodzielnie zainstalować nowy skill. Brama nie ma żadnych takich szwów. Każde wywołanie, które twój agent wydaje, niezależnie od modelu, dostawcy lub jak zdolność narzędzia dotarła, przechodzi przez jeden punkt, zanim cokolwiek dotrze do miejsca nadrzędnego. To jedyna warstwa, gdzie możesz dać gwarancję: jeśli to się zdarzyło, brama to widziała. OrcaRouter używa tej pozycji dla dwóch odrębnych przejść egzekwowania:- Guardrails sprawdzają tekst — prompt, który twój agent wysyła, i
odpowiedź, którą model zwraca. Blokada guardrail zwraca HTTP 400
guardrail_blockedi nie kosztuje limitu. - Firewall ocenia akcje — narzędzia, które agent wywołuje, serwery MCP,
do których sięga, i miejsca docelowe w sieci, które raportuje. Odmowa
firewalla zwraca HTTP 400
firewall_blockedna powierzchni inbound lub błąd narzędzia na powierzchni MCP, więc model widzi odrzucenie i może o nim wnioskować.
https://api.orcarouter.ai/v1 dokładnie jak wcześniej.
2. Cztery powierzchnie egzekwowania
Firewall ewaluuje każde wywołanie narzędzia wobec dokładnie jednej powierzchni — punktu w cyklu życia wywołania, w którym brama je widzi.| Powierzchnia | Co widzi brama |
|---|---|
inbound | Narzędzia, które twój agent ogłasza modelowi w żądaniu — definicje narzędzi. Blokowanie tutaj uniemożliwia modelowi wybranie niebezpiecznego narzędzia. |
response | tool_calls, które model emituje w swojej odpowiedzi — wybrane akcje modelu przed ich dyspozycją. |
mcp | tools/call dyspozytowane przez bramę Firewall MCP lub ewaluowane przez hook SDK — wywołanie w momencie dyspozycji. |
egress | Wychodzący cel sieciowy (host / IP / CIDR) zgłaszany przez narzędzie — powierzchnia SSRF i eksfiltracji danych. |
input (prompt żądania i wiadomości) i output (tekst
odpowiedzi modelu). Jedno żądanie może przejść przez wszystkie z nich.
3. Wykrywanie przy pierwszym użyciu
Wykrywanie odbywa się w bramie, przy pierwszym użyciu — nie w momencie
instalacji. Narzędzie, serwer MCP lub skill, który agent samodzielnie
instaluje, jest wychwycony przy pierwszym przekroczeniu bramy przez jego
wywołanie. To celowe: brama jest jedynym punktem zwężenia, który widzi
każdego dostawcę, każdego agenta i każde wywołanie niezależnie od tego, jak
zdolność dotarła. Czekanie na wykrywanie w momencie instalacji przegapiłoby
zdolności załadowane w czasie wykonywania.
4. Czego brama nie może zobaczyć
Gwarancja inspekcji obejmuje wywołania, które przekraczają bramę. Nie rozciąga się na narzędzie, które twój agent uruchamia całkowicie wewnątrz własnego procesu — które odczytuje lokalny plik, wywołuje funkcję biblioteki lub wykonuje podproces bez wysyłania wiadomości do bramy. To jest uczciwa granica, nie wada projektowa. Celem projektowym jest uczynienie bramy audytowaną ścieżką dla wywołań, które mają znaczenie — tych z rzeczywistymi konsekwencjami:| Gdzie działa | Brama to widzi? | Jak zamknąć lukę |
|---|---|---|
Wywołanie narzędzia mediowane przez model (model emituje tool_calls) | Tak — powierzchnia response | Nie potrzebne żadne działanie; już zarządzane. |
| Dyspozycja MCP przez bramę Firewall MCP | Tak — powierzchnia mcp | Nie potrzebne żadne działanie; już zarządzane. |
Twój agent wywołuje POST /api/v1/firewall/evaluate przed dyspozycją | Tak — ewaluowane inline | Już zarządzane przez hook evaluate. |
| Narzędzie działa w procesie, bez kontaktu z bramą | Nie | Kieruj dyspozycję MCP i narzędzia wywołujące sieć przez bramę zamiast wywoływać je bezpośrednio z procesu agenta. |
5. Bramkowanie ról dla danych inspekcji
Dostęp do powierzchni inspekcji jest ograniczony rolami w twojej przestrzeni roboczej:| Zdolność | Minimalna rola |
|---|---|
| Odczyt dopasowań guardrail, polityk firewalla i odkrytych narzędzi | Member |
| Odczyt strumieni Events i Runs firewalla | Developer |
| Tworzenie lub zmiana guardrails, polityk firewalla, reguł | Developer |
Eksporty zgodności, plaintext klucza z zakresem firewall-gateway, flaga klucza is_firewall_gateway | Admin |
Token z zakresem firewall-gateway (klucz używany do wywołania
/api/v1/firewall/evaluate i bramy MCP) wymaga roli Admin do stworzenia.
Zwykły klucz API zwraca 403 na tych trasach.6. Co dalej
Stos kontrolny
Pełna ścieżka żądania — klucz, guardrails, model, firewall, audyt —
na jednym diagramie.
Współdzielona odpowiedzialność
Co zabezpiecza brama, a co pozostaje w twojej aplikacji.
Agent Firewall
Twórz polityki, konfiguruj powierzchnie i zarządzaj wywołaniami narzędzi
w szczegółach.
