1. Odcisk palca bazy
Przy pierwszym kontakcie brama oblicza kanoniczny hash ogłoszonego zestawu narzędzi serwera i przechowuje go jako zatwierdzoną bazę:- Hash pokrywa nazwę, opis i schemat wejścia JSON każdego narzędzia — dokładnie powierzchnię, którą rug-pull by zmienił (narzędzie zyskujące argument eksfiltracji lub opis uzbrojony pod prompt injection przerzuca hash).
- Jest niezależny od kolejności: serwer zmieniający kolejność swojej listy narzędzi lub kolejność kluczy wewnątrz schematu nie wygląda jak zmiana. Tylko prawdziwa zmiana definicji przesuwa hash.
2. Cykl życia statusu schematu
Każdy zarejestrowany serwer niesieschema_status. Stany i jak wpływają na to,
czy narzędzia serwera są serwowane:
| Status | Znaczenie | Narzędzia serwowane? |
|---|---|---|
| (niebaselinowany) | Pierwsze użycie — żadna baza jeszcze nie zarejestrowana. | Postawa odkrywcza: Tak (trust-on-first-use — bieżący schemat jest przechwytywany jako baza). Postawa ścisła: Nie — zobacz pending poniżej. |
verified | Żywy schemat pasuje do zatwierdzonej bazy. | Tak |
changed | Wykryto dryf — żywy schemat różni się od bazy. | Nie — zawodzi zamknięty |
pending | Niebaselinowany serwer pod ścisłą (bez trust-on-first-use) postawą — oczekuje na zatwierdzenie. | Nie — zawodzi zamknięty |
quarantined | Admin wstrzymał serwer. | Nie — zawodzi zamknięty |
Trzy stany zamknięte —
changed, pending, quarantined — wszystkie
zatrzymują serwowanie narzędzi serwera przez bramę. verified zawsze
serwuje; niebaselinowany serwer serwuje tylko pod postawą odkrywczą
(trust-on-first-use) i jest wstrzymany jako pending pod postawą ścisłą. Dryf
nigdy nie przechodzi po cichu.3. Co dzieje się przy dryfie
Gdy ponowne sprawdzenie znajdzie, że żywy schemat nie pasuje już do bazy:Status przerzuca się na changed
schema_status serwera staje się changed i rejestrowany jest znacznik
czasu dryfu.Narzędzia przestają być serwowane
Brama zawodzi zamknięta: narzędzia tego serwera są wstrzymane z
ujednoliconej powierzchni MCP, więc agent nie może wywołać zmienionych
definicji.
Konsola to wystawia
Dryf pojawia się do recenzji, tak by admin mógł porównać nowy zestaw
narzędzi z zatwierdzonym.
4. Ponowne zatwierdzanie zdryfowanego serwera
Ponowne baselinowanie to pojedyncze wywołanie (lub akcja konsoli):verified. (Kwarantanna serwera to
osobna akcja, gdy zdecydujesz, że zmiana jest wroga — approve_schema
tylko baselinuje ponownie do verified.) Akcja jest zapisywana do śladu
audytu.
5. Gdzie to pasuje
Wykrywanie dryfu schematu to schematowa połowa obrony przed rug-pull; druga połowa to ewaluacja per wywołanie na powierzchnimcp (każde tools/call jest
sprawdzane wobec twojej polityki przy dyspozycji). Razem pokrywają zarówno
„definicje się zmieniły”, jak i „to konkretne wywołanie jest niebezpieczne”.
Obrona przed rug-pull
Pełny obraz rug-pull — baza schematu plus ewaluacja per wywołanie.
Przegląd bezpieczeństwa MCP
Brama MCP, skille i poświadczenia.
Zatruwanie narzędzi MCP
Zagrożenie, przeciwko któremu broni ta maszyna stanów.
Zdarzenia audytu MCP
Monitorowanie zmian schematu i decyzji bramy.
