메인 콘텐츠로 건너뛰기
“러그풀(rug-pull)“은 승인한 후 툴 정의를 변경하는 MCP 서버입니다 — 신뢰된 툴을 새로운 무언가를 하도록 재정의하거나, 조용히 하나를 추가합니다. OrcaRouter는 이것을 스키마 레이어에서 잡습니다: 각 서버의 광고된 툴 세트를 기준선화하고 모든 로드에서 다시 검사하므로, 드리프트는 닫힘으로 실패하며 변경된 툴을 조용히 제공하지 않습니다. 이 페이지는 서버별 스키마 상태와 각 상태가 트래픽에 의미하는 바에 대한 레퍼런스입니다.

1. 기준선 지문

첫 접촉 시 게이트웨이는 서버의 광고된 툴 세트의 정규 해시를 계산하고 그것을 승인된 기준선으로 저장합니다:
  • 해시는 모든 툴의 이름, 설명, 그리고 입력 JSON 스키마를 커버합니다 — 정확히 러그풀이 변경할 표면(유출 인자를 얻는 툴, 또는 프롬프트 인젝션을 위해 무기화된 설명이 해시를 뒤집습니다).
  • 그것은 순서 독립적입니다: 서버가 툴 목록을 재정렬하거나, 스키마 내부의 키를 재정렬해도 변경처럼 보이지 않습니다. 진짜 정의 변경만이 해시를 움직입니다.
이후 모든 프로브에서 게이트웨이는 라이브 툴을 다시 해싱하고 저장된 기준선과 비교합니다. 이것은 서버별 검사입니다 — 당신이 작성하는 어떤 규칙에도 의존하지 않습니다.

2. 스키마 상태 수명 주기

각 등록된 서버는 schema_status를 담습니다. 상태들과 그것들이 서버의 툴이 제공되는지에 영향을 미치는 방식:
상태의미툴 제공?
(기준선화 안 됨)첫 사용 — 아직 기준선 미기록.발견 자세: 예(trust-on-first-use — 현재 스키마가 기준선으로 캡처됨). 엄격 자세: 아니요 — 아래 pending 참조.
verified라이브 스키마가 승인된 기준선과 일치.
changed드리프트 탐지 — 라이브 스키마가 기준선과 다름.아니요 — 닫힘으로 실패
pending엄격(no trust-on-first-use) 자세 하의 기준선화되지 않은 서버 — 승인 대기.아니요 — 닫힘으로 실패
quarantinedadmin이 서버를 보류함.아니요 — 닫힘으로 실패
세 가지 닫힘 상태 — changed, pending, quarantined — 는 모두 서버의 툴이 게이트웨이를 통해 제공되는 것을 중단시킵니다. verified는 항상 제공합니다; 기준선화되지 않은 서버는 발견 자세(trust-on-first-use) 하에서만 제공되고 엄격 자세 하에서는 pending으로 보류됩니다. 드리프트는 결코 조용히 통과하지 않습니다.

3. 드리프트 시 일어나는 일

다시 검사할 때 라이브 스키마가 더 이상 기준선과 일치하지 않음을 발견하면:
1

상태가 changed로 뒤집힘

서버의 schema_statuschanged가 되고 드리프트 타임스탬프가 기록됩니다.
2

툴 제공이 중단됨

게이트웨이가 닫힘으로 실패합니다: 그 서버의 툴이 통합 MCP 표면에서 보류되므로, 에이전트가 변경된 정의를 호출할 수 없습니다.
3

콘솔이 표면화함

드리프트가 검토를 위해 나타나므로 admin이 새 툴 세트를 승인된 것과 비교할 수 있습니다.
4

다시 기준선화 또는 격리

admin이 새 스키마를 승인(다시 기준선화 — 현재 툴 세트가 새 verified 기준선이 됨)하거나 서버를 격리합니다. 둘 중 하나가 일어날 때까지, 서버는 닫힌 채 유지됩니다.

4. 드리프트된 서버를 다시 승인하기

다시 기준선화는 단일 호출(또는 콘솔 액션)입니다:
POST /api/workspace/firewall/mcp_servers/:id/approve_schema
Developer 역할이 필요합니다. 그것은 라이브 툴 세트를 새로운 승인된 기준선으로 기록하고 서버를 verified로 되돌립니다. (서버를 격리하는 것은 변경이 적대적이라고 결정할 때를 위한 별도 액션입니다 — approve_schemaverified로 다시 기준선화만 합니다.) 그 액션은 감사 추적에 기록됩니다.
diff를 검토한 후에만 다시 승인하세요. 드리프트된 스키마를 확인 없이 승인하는 것은 통제를 무력화합니다 — 그것은 OrcaRouter에 새로운(어쩌면 악성인) 툴 정의가 신뢰된다고 말합니다.

5. 이것이 들어맞는 곳

스키마 드리프트 탐지는 러그풀 방어의 스키마 레이어 절반입니다; 나머지 절반은 mcp 표면에서의 호출별 평가입니다(모든 tools/call이 디스패치 시 당신의 정책에 대해 검사됨). 함께 그것들은 “정의가 변경되었다”와 “이 특정 호출이 위험하다” 둘 다를 커버합니다.

러그풀 방어

전체 러그풀 그림 — 스키마 기준선 더하기 호출별 평가.

MCP 보안 개요

MCP 게이트웨이, 스킬, 그리고 자격 증명.

MCP 툴 포이즈닝

이 상태 기계가 방어하는 위협.

MCP 감사 이벤트

스키마 변경과 게이트웨이 결정 모니터링.