shell.exec i zewnętrzny zakres sieciowy, to dokładnie ten
rodzaj rzeczy, który powinien zostać zrecenzowany zanim się uruchomi, a
nie odkryty w incydencie.
Zarządzanie Skillami Firewalla to ta recenzja. Każda instalowalna
zdolność jest rejestrowana jako rekord w zakresie przestrzeni roboczej,
skanowana przez deterministyczny silnik ryzyka, przypisana do pasma ryzyka
i trybu egzekwowania — a w czasie wykonania ten tryb jedzie na wierzchu
werdyktów reguł firewalla.
1. Czym jest tutaj „skill”
Rekord skilla to jedna instalowalna zdolność agenta. Pojedynczy model uogólnia trzy rodzaje, więc jedna płaszczyzna skanowania, oceniania i zatwierdzania zarządza wszystkim, co agent sam instaluje:| Rodzaj | Czym jest |
|---|---|
skill | Spakowana zdolność — manifest plus zestaw narzędzi i fragment promptu systemowego. |
mcp_server | Serwer MCP typu bring-your-own zarejestrowany jako zarządzany artefakt. |
plugin | Rozszerzenie w stylu pluginu. |
builtin, registry, private,
byo_mcp lub auto_detected — które zasila ocenę zaufania.
2. Skaner
Przy rejestracji (i na żądanie) skaner uruchamia zestaw deterministycznych, wolnych od zależności przejść po manifeście i zadeklarowanych zakresach. Każde przejście emituje findings z ważnościąinfo, warn lub error:
| Przejście | Flaguje | Ważność |
|---|---|---|
| prompt_injection | Tekst manifestu, który próbuje nadpisać instrukcje (ignore previous instructions, you are now, wiodące system:…). | warn |
| tool_creep | Nazwy narzędzi, których manifest używa, ale nie zadeklarował w allowed_tools. | error |
| network_egress | Hosty HTTP(S) w manifeście, które nie są zatwierdzone w zakresach sieciowych skilla. | warn |
| fs_write_unsafe | Zakres systemu plików w trybie zapisu na ścieżce poza /tmp (odporny na traversal). | error |
| data_scope | Wrażliwe zakresy danych (pii, financial, customer). | info |
| unsigned | Skill registry bez podpisu. | warn |
error → blocked; w
przeciwnym razie dowolny warn → flagged; w przeciwnym razie clean.
3. Wynik ryzyka i pasma
Te same findings zasilają deterministyczny wynik ryzyka (0–100, addytywny z limitami per kategoria). Najcięższymi kontrybutorami są niebezpieczne zdolności:| Zdolność | Waga |
|---|---|
| Wykonanie shell | +30 |
| Dowolna ewaluacja kodu | +30 |
Zapis systemu plików poza /tmp | +25 |
| Odczyt sekretów | +25 |
| Zewnętrzny egress sieciowy | +20 |
| Pasmo | Wynik |
|---|---|
low | 0–25 |
medium | 26–50 |
high | 51–75 |
critical | 76–100 |
4. Tryb egzekwowania
Pasmo i werdykt razem wyprowadzają tryb egzekwowania — to, co firewall faktycznie robi, gdy wywoływane jest narzędzie będące własnością tego skilla:| Tryb | Efekt w czasie wykonania |
|---|---|
allow | Skill niczego od siebie nie narzuca; decydują werdykty reguł. |
quarantine | Eskaluj wszystko poniżej deny do pending_approval — narzędzia skilla uruchamiają się dopiero po zatwierdzeniu przez człowieka. |
block | Wymuś deny na narzędziach skilla. |
error, który czyni
werdykt blocked, podda kwarantannie lub zablokuje nawet wtedy, gdy
numeryczne pasmo jest low — kierunek ostrożny. Operator może ustawić tryb
jawnie; przy ponownym skanie tryb zaciska się tylko ciaśniej, nigdy nie
rozluźniając bloku ani kwarantanny, które ustawiłeś.
5. Sygnały zaufania
Dwa sygnały poza statycznym skanem informują o tym, jak traktowany jest skill:- Podpisani wydawcy. Skill niosący podpis od zaufanego wydawcy jest traktowany jako bardziej godny zaufania (mitygacja podpisu obniża jego wynik ryzyka); niepodpisany skill registry jest penalizowany. Zarządzasz tym, którym wydawcom twoja przestrzeń robocza ufa.
- Reputacja zasobu. Pozycja skilla może być korygowana przez jego zachowanie na żywo w czasie — odmowy i anomalie podnoszą jego ryzyko, czyste serie je obniżają — więc artefakt, który źle się zachowuje na produkcji, dryfuje ku kwarantannie, nawet jeśli jego manifest zeskanował się czysto.
6. Auto-wykrywane zdolności
Skaner nie uruchamia się tylko wtedy, gdy rejestrujesz coś ręcznie. Gdy agent sam instaluje zdolność, a jej narzędzia po raz pierwszy przekraczają bramę, Firewall auto-wykrywa ją (poza gorącą ścieżką, asynchronicznie), syntetyzuje manifest z tego, co zaobserwował, i uruchamia ten sam skan, ocenę i wyprowadzenie trybu — zsource = auto_detected.
Auto-wykryte zdolności są poddane kwarantannie aż do recenzji.
Wszystko auto-wykryte, co w przeciwnym razie rozwiązałoby się do
allow,
jest sprowadzane do quarantine (a critical pozostaje block), dopóki
człowiek tego nie zrecenzuje. Zdolność, której nikt nie zatwierdził, nie
dostaje darmowej przepustki tylko dlatego, że zeskanowała się nieszkodliwie
— uruchamia się dopiero po tym, jak na nią spojrzysz.7. Runtime enforcement
Gdy wywołanie narzędzia dociera do silnika firewalla, jest przypisywane do skilla będącego właścicielem, a potem tryb skilla jest stosowany na wierzchu werdyktu reguły:- Przypisanie. Wywołanie jest dopasowywane do skilla po jego
zadeklarowanych
allowed_tools, potem po przedrostku przestrzeni nazwmcp_server, a potem po obejmującym całą przestrzeń roboczą najbardziej restrykcyjnym egzekwującym fallbacku. - Werdykt reguły. Reguły polityki biegną jak zwykle — a
skill_name_globreguły pozwala zawęzić regułę do konkretnych skilli. - Nadpisanie trybem. Skill
blockwymusza deny; skillquarantineeskaluje wszystko poniżej deny dopending_approval;allowzostawia werdykt nietknięty.
Przypisanie skilla fail closed. Jeśli narzędzia nie da się przypisać
(błąd DB bez cache lub niezadeklarowane narzędzie pod kuratorowanym
źródłem), wywołanie jest wstrzymane do recenzji, zamiast dopuszczone. A
tryb skilla jest niezależny od trybu cienia — skill poddany kwarantannie
lub zablokowany jest wciąż egzekwowany, nawet gdy polityka jest w
wdrożeniu cieniowym.
8. Cykl życia
- Rejestracja —
POST /skillswaliduje i skanuje synchronicznie, zwracając skill plus jego findings i werdykt. Tryb jest wyprowadzany (lub honorowany jest twój jawny tryb). - Aktualizacja — ponownie skanuje nowy manifest; tryb zaciska się ciaśniej przy pogorszonym skanie, ale nigdy nie rozluźnia twojego przechowywanego block/quarantine.
- Ponowny skan —
POST /skills/:id/rescanponownie uruchamia skan; jeśli werdykt na nowo degraduje się do flagged lub blocked, emituje zdarzenie firewalla, więc dryf pojawia się w twoim strumieniu. - Usunięcie — miękko usuwa i zwalnia slot nazwy do ponownej rejestracji.
API reference
W zakresie przestrzeni roboczej; odczyty list są otwarte dla każdego członka (i redagują pola niosące sekrety), wszystko inne wymaga Developer+.| Metoda i ścieżka | Rola | Cel |
|---|---|---|
GET /api/workspace/firewall/skills | Member | Lista skilli (zredagowana; filtruj po ?kind= i ?source=). |
GET /api/workspace/firewall/skills/:id | Developer+ | Pełny rekord skilla. |
POST /api/workspace/firewall/skills | Developer+ | Zarejestruj + zeskanuj (409 przy zduplikowanej nazwie). |
PUT /api/workspace/firewall/skills/:id | Developer+ | Zaktualizuj + ponownie zeskanuj. |
POST /api/workspace/firewall/skills/:id/rescan | Developer+ | Ponowny skan; emituje zdarzenie przy degradacji. |
DELETE /api/workspace/firewall/skills/:id | Developer+ | Miękkie usunięcie. |
Nazwy są unikalne per przestrzeń robocza w poprzek rodzajów —
skill
o nazwie github i mcp_server o nazwie github kolidują w tej samej
przestrzeni roboczej. Wybierz odrębne nazwy per artefakt.FAQ
Czym to się różni od DSL reguł?
Czym to się różni od DSL reguł?
Reguły bramkują wywołania narzędzi po
nazwie i argumentach. Skille bramkują zdolności, które agent ładuje —
pakiet, jego manifest i jego żądane uprawnienia — zanim którekolwiek z
jego narzędzi się uruchomi. Tryb skilla jedzie potem na wierzchu tego,
co zdecydują reguły, więc oba się komponują: reguła może
allow
http.fetch ogólnie, podczas gdy skill poddany kwarantannie, który go
posiada, wciąż zostaje wstrzymany.Co powstrzymuje złośliwy skill przed zadeklarowaniem czystego manifestu?
Co powstrzymuje złośliwy skill przed zadeklarowaniem czystego manifestu?
Kilka rzeczy. Wykrywanie tool-creep flaguje narzędzia użyte, ale nie
zadeklarowane; auto-wykrywanie ponownie skanuje z tego, co faktycznie
przekroczyło bramę, a nie tylko z deklarowanego manifestu; tryb zaciska
się ciaśniej (nie luźniej) przy ponownym skanie; reputacja zasobu
dryfuje źle zachowujący się artefakt ku kwarantannie w czasie; a
przypisanie fail closed, gdy narzędzia nie da się powiązać z
zadeklarowanym skillem.
Czy muszę rejestrować każdy skill ręcznie?
Czy muszę rejestrować każdy skill ręcznie?
Nie. Zarejestruj te, które chcesz wstępnie zatwierdzić; reszta jest
auto-wykrywana przy pierwszym użyciu i poddawana kwarantannie, dopóki
ich nie zrecenzujesz. Włącz tryb obserwacji, aby wydobyć wszystko, co
agent instaluje, bez blokowania, a potem zaciskaj z prawdziwych danych.
Zobacz także
Chcesz głębiej wejść w bezpieczeństwo agentów? Przewodniki Secure Your Agents (Zero Trust) osadzają tę funkcję w przepływie pracy zero-trust.Baza Secure Agents
Zastosuj postawę zero-trust do każdej zdolności agenta jednym przełącznikiem.
Guardrails dla agentów
Guardrails zbudowane dla autonomicznych agentów używających narzędzi.
