bezpieczeństwa łańcucha dostaw AI; referencje Firewalla
i Skilli niosą pełną mechanikę.
1. Bezpieczeństwo łańcucha dostaw AI dla agentów, w bramie
Punktem zwężenia jest ścieżka relay. Niezależnie od tego, czy zdolność została zarejestrowana ręcznie, auto-zainstalowana przez agenta, czy pociągnięta z rejestru społecznościowego, jej pierwsze wywołanie narzędzia przekraczaapi.orcarouter.ai — i to tam Firewall je ewaluuje. Cztery kontrole komponują
się w pojedynczą postawę:
Brama MCP, eval per wywołanie
Każde
tools/call jest ewaluowane wobec twojej polityki przed dyspozycją
— manifest nigdy nie jest źródłem prawdy.Pasma ryzyka i kwarantanna skilli
Zainstalowane zdolności są skanowane, oceniane i wstrzymywane do przeglądu,
dopóki człowiek ich nie zatwierdzi.
Zaszyfrowane poświadczenia MCP
Sekrety auth serwera są szyfrowane w spoczynku i wstrzykiwane przy
dyspozycji — nigdy nie ujawniane modelowi, agentowi ani argumentom
wywołań.
Listy dozwolonych egress
Przypnij, dokąd wywołania narzędzi mogą wysyłać dane, aby skompromitowana
zależność nie mogła eksfiltrować do hosta, którego nigdy nie zatwierdziłeś.
Wykrywanie odbywa się w bramie, przy pierwszym użyciu — nie w twoim menedżerze
pakietów ani systemie plików. To celowe: to jedyna ścieżka, która widzi
każdego agenta i każde wywołanie narzędzia niezależnie od tego, jak
zdolność się tam wzięła.
2. Zagrożenie: zależność, która rośnie po tym, jak jej zaufasz
| Wektor | Co się dzieje |
|---|---|
| Rug-pull | Zarejestrowany serwer MCP dodaje narzędzie (shell.exec, nowy fetch), którego nigdy nie zatwierdziłeś. |
| Pełzanie skilla | Zainstalowany skill używa narzędzi lub hostów, których jego manifest nigdy nie zadeklarował. |
| Kradzież poświadczeń | Implementacja narzędzia skompromitowanego serwera odczytuje własny sekret auth, by zadzwonić do domu. |
| Eksfiltracja egress | Łańcuch pobierz→wyślij transportuje twoje dane do hosta kontrolowanego przez atakującego. |
3. Jeden konkretny przykład — rejestrowanie i przypinanie serwera MCP
Rejestrujesz serwer MCP innej firmy z konsoli (Settings → Firewall → MCP servers; zapisy wymagają Developer+). Sekret auth serwera jest przechowywany zaszyfrowany — dostarczasz go raz, brama wstrzykuje go przy dyspozycji, a jest maskowany przy każdym odczycie potem. Rekord serwera MCP niesie:| Pole | Wartości |
|---|---|
auth_mode | none, bearer, oauth, basic |
status | ok, degraded, down (ustawiane przez sondę zdrowia) |
credentials | zaszyfrowane w spoczynku, nigdy nie zwracane w postaci jawnej |
/api/workspace/firewall/*),
która wymaga Developer+, nie klucza relay — rejestracja, sondowanie i
pisanie reguł wszystkie odbywają się na płaszczyźnie zarządzania:
tool_name_glob: <server>.* do pending_approval, dopóki
nie zobaczysz czystej historii wywołań — każde wywołanie z tego serwera jest
wstrzymane dla człowieka, zanim się uruchomi. Gdy mu zaufasz, rozluźnij regułę
do audit lub allow. Od tego momentu brama MCP ewaluuje każde
tools/call na powierzchni mcp przed dyspozycją — więc jeśli rug-pull
później doda niezadeklarowane narzędzie, twoja polityka, nie manifest serwera,
decyduje, czy się uruchomi.
4. Pasma ryzyka i kwarantanna skilli
Każda instalowalna zdolność — czy ją zarejestrowałeś, czy brama auto-wykryła ją w czasie wykonania — jest przepuszczana przez skaner skilli. Znaleziska zwijają się do pasma ryzyka i trybu egzekwowania:Pasma ryzyka
Pasma ryzyka
low · medium · high · critical. Pasmo jest wyprowadzane z
deterministycznych przebiegów skanera nad manifestem i zadeklarowanymi
zakresami (niezadeklarowane użycie narzędzi, egress sieciowy poza
zatwierdzonymi zakresami, niebezpieczne zapisy do systemu plików, tekst
manifestu w kształcie injection).Tryby egzekwowania
Tryby egzekwowania
allow (decydują twoje reguły polityki), quarantine (dowolny werdykt
poza deny eskaluje do pending_approval — człowiek zatwierdza każde
wywołanie), block (wymuś deny na wszystkich narzędziach tego skilla
niezależnie od reguł). Skill pasma high poddaje się kwarantannie
automatycznie; critical blokuje.Dlaczego auto-wykryte = zawsze poddane kwarantannie
Dlaczego auto-wykryte = zawsze poddane kwarantannie
Zdolność, którą agent sam instaluje, lub narzędzie, które dodaje rug-pull,
jest wstrzymywane w
pending_approval niezależnie od jego wyniku skanu,
dopóki człowiek go nie przejrzy. Operator nie może po cichu dodać narzędzia
i sprawić, by twoje agenty zaczęły go używać.5. Listy dozwolonych egress — ogranicz „dzwonienie do domu”
Najbardziej szkodliwym efektem łańcucha dostaw jest skompromitowana zależność, która eksfiltruje. Powierzchniaegress Firewalla ewaluuje wychodzące miejsce
docelowe (host / IP / CIDR), które narzędzie zgłasza, więc możesz przypiąć,
dokąd dane mogą iść.
Sam piszesz regułę egress: lista dozwolonych host/CIDR z predykatem
cidr_match odmawia wszystkiego spoza listy. Połącz ją z regułą sekwencji,
która łamie łańcuch pobierz→egress, a zatrute narzędzie, które próbuje
przetransportować pobrany dokument do nieznanego hosta, jest odmawiane w
bramie.
6. Zaszyfrowane poświadczenia — skompromitowany serwer nie może odczytać twoich kluczy
Sekrety auth serwera są szyfrowane w spoczynku i wstrzykiwane przez bramę w czasie dyspozycji. Nigdy nie docierają do modelu, agenta ani argumentów wywołania narzędzia — więc skompromitowany lub złośliwy serwer nie może eksfiltrować twoich kluczy API przez odczytanie własnego bloba poświadczeń. Konsola zawsze zwraca sekret zamaskowany — nawet Adminowi. Odszyfrowana wartość jest wydawana na dokładnie jednej ścieżce: żądaniu niosącym token w zakresie firewall-gateway (dedykowany typ tokena, który Admin jawnie wybija dla bramy/proxy), więc zwykły wyciekły klucz relay nie może wyliczyć twoich poświadczeń MCP.7. Zwijanie tego do audytu
Zarządzanie łańcuchem dostaw jest też artefaktem audytu. OrcaRouter mapuje się na OWASP Top 10 dla aplikacji LLM — w tym kontrolę LLM05 Supply Chain — jako część silnika zgodności, obok frameworków takich jaksoc2,
iso_27001, iso_42001, nist_ai_rmf oraz eu_ai_act.
Instalacja pakietu zgodności
(POST /api/compliance/packs/:key/install, Admin przestrzeni roboczej,
plan płatny) materializuje pasujące guardrails i polityki firewalla i zaczyna
w postawie observe-first. Raporty zgodności zawierają sekcję dowodów
łańcucha-dostaw-AI — dostawców nadrzędnych, do których twoja przestrzeń
robocza faktycznie routowała, plus przegląd dostępu uprzywilejowanego i
higieny kluczy — i są podpisane Ed25519 oraz publicznie weryfikowalne.
Przeglądanie katalogu i gotowości jest darmowe dla każdego Membera; zobacz
Zgodność dla pełnego cyklu życia.
Zarządzanie MCP to dwie komplementarne warstwy: ewaluacja firewalla per
wywołanie na powierzchni
mcp (egzekwowanie tego, co zależność robi),
plus bazowa linia integralności schematu narzędzi (hash trust-on-first-use
ogłoszonego zestawu narzędzi, ponownie sprawdzany przy każdej sondzie — dryf
przeskakuje schema_status serwera na changed i powoduje fail-closed
dyspozycji, dopóki admin nie zrobi ponownej bazowej linii lub nie podda go
kwarantannie). Razem z pasmami ryzyka skilli i kwarantanną to egzekwowanie
zarówno tego, co zależność robi, jak i weryfikowalny zapis tego, co
zadeklarowała.8. Baza łańcucha dostaw
Zanim zaufasz nowemu serwerowi MCP lub skillowi
Zanim zaufasz nowemu serwerowi MCP lub skillowi
Zarejestruj go, sonduj jego zestaw narzędzi i ogranicz zakres reguły
<server>.* do pending_approval lub audit. Przeczytaj znaleziska
skanu — każde znalezisko niezadeklarowanego-narzędzia lub
zewnętrznego-egress to powód, by trzymać go w kwarantannie. Zweryfikuj,
kto kontroluje URL endpointa.W stanie ustalonym
W stanie ustalonym
Trzymaj listę dozwolonych egress przypiętą dla każdego agenta z
narzędziami fetch/search/export. Obserwuj widok
Discovered tools pod kątem zdolności, które
pojawiły się bez reguły, oraz strumień anomalii pod kątem nowych ścieżek
narzędzie-do-narzędzia.
Po podejrzanym rug-pullu
Po podejrzanym rug-pullu
Wyłącz serwer (
PUT .../mcp_servers, "enabled": false) — jego
poświadczenia nigdy nie są odszyfrowywane, gdy wyłączony. Sonduj ponownie,
aby wypłynąć nowe narzędzia, przeskanuj skill ponownie i przejrzyj kolejkę
pending_approval zamiast masowego zatwierdzania.9. Pokrewne zagrożenia i pojęcia
- Zatrucie narzędzi MCP i rug-pulle — głębokie nurkowanie w złośliwe i porwane serwery MCP.
- Eksfiltracja danych — reguły egress, które ograniczają, dokąd wywołania narzędzi mogą wysyłać dane.
- Niebezpieczne wywołania narzędzi — blokowanie destrukcyjnych akcji niezależnie od tego, skąd narzędzie się wzięło.
- Wyciek sekretów — trzymanie poświadczeń poza promptami, argumentami i logami.
- Zabezpieczanie agentów AI oraz stos kontrolny — jak te kontrole pasują do szerszej postawy.
Firewall: Serwery MCP
Rejestruj serwery MCP za bramą, sonduj ich narzędzia i stosuj werdykt per
wywołanie, zanim jakiekolwiek wywołanie dotrze do prawdziwego serwera.
Firewall: Skille
Skanuj i oceniaj ryzyko każdej instalowalnej zdolności. Poddawaj
kwarantannie lub blokuj ryzykowne skille, zanim ich narzędzia się
uruchomią.
