bảo mật chuỗi cung ứng ai;
các tham chiếu Firewall và
Skills mang theo toàn bộ cơ chế.
1. Bảo mật chuỗi cung ứng ai cho agent, tại gateway
Điểm nghẽn là đường relay. Dù một khả năng được đăng ký bằng tay, tự cài đặt bởi agent, hay kéo từ một registry cộng đồng, cuộc gọi tool đầu tiên của nó vượt quaapi.orcarouter.ai — và đó là nơi Firewall đánh giá nó. Bốn kiểm
soát kết hợp thành một tư thế duy nhất:
MCP gateway, đánh giá theo từng cuộc gọi
Mỗi
tools/call được đánh giá đối với chính sách của bạn trước khi
dispatch — manifest không bao giờ là nguồn chân lý.Phân dải rủi ro & quarantine skill
Các khả năng được cài đặt được quét, chấm điểm, và giữ lại để xem xét cho
đến khi một con người duyệt chúng.
Credential MCP được mã hóa
Các secret xác thực server được mã hóa khi nghỉ và tiêm vào lúc dispatch —
không bao giờ phơi bày cho mô hình, agent, hay các argument cuộc gọi.
Allow-list egress
Ghim nơi các cuộc gọi tool có thể gửi dữ liệu, nên một dependency bị xâm
phạm không thể exfiltrate tới một host bạn chưa bao giờ duyệt.
Phát hiện ở gateway, ở lần dùng đầu tiên — không phải trong package manager
hay filesystem của bạn. Đó là chủ đích: đó là con đường duy nhất thấy mọi
agent và mọi cuộc gọi tool bất kể khả năng đó đến đó bằng cách nào.
2. Mối đe dọa: một dependency phát triển sau khi bạn tin tưởng nó
| Vector | Điều xảy ra |
|---|---|
| Rug-pull | Một MCP server đã đăng ký thêm một tool (shell.exec, một fetch mới) bạn chưa bao giờ duyệt. |
| Skill creep | Một skill được cài đặt dùng các tool hoặc host mà manifest của nó chưa bao giờ khai báo. |
| Trộm credential | Phần triển khai tool của một server bị xâm phạm đọc secret xác thực của chính nó để gọi về nhà. |
| Exfiltration egress | Một chuỗi truy-xuất→gửi vận chuyển dữ liệu của bạn tới một host do kẻ tấn công kiểm soát. |
3. Một ví dụ cụ thể — đăng ký và ghim một MCP server
Bạn đăng ký một MCP server của bên thứ ba từ console (Settings → Firewall → MCP servers; ghi cần Developer+). Secret xác thực của server được lưu mã hóa — bạn cung cấp nó một lần, gateway tiêm nó lúc dispatch, và nó được mask trên mọi lần đọc sau đó. Một bản ghi MCP server mang theo:| Field | Giá trị |
|---|---|
auth_mode | none, bearer, oauth, basic |
status | ok, degraded, down (do health probe đặt) |
credentials | mã hóa khi nghỉ, không bao giờ trả về dưới dạng plaintext |
/api/workspace/firewall/*) cần
Developer+, không phải một key relay — đăng ký, probe, và soạn quy tắc
tất cả đều diễn ra trên mặt phẳng quản lý:
tool_name_glob: <server>.* thành pending_approval
cho đến khi bạn đã thấy một lịch sử cuộc gọi sạch — mỗi cuộc gọi từ server đó
được giữ lại cho một con người trước khi nó chạy. Một khi bạn tin tưởng nó,
nới lỏng quy tắc thành audit hoặc allow. Từ điểm đó trở đi MCP gateway
đánh giá mọi tools/call trên bề mặt mcp trước khi dispatch — nên nếu
một rug-pull sau đó thêm một tool chưa khai báo, chính sách của bạn, không
phải manifest của server, quyết định liệu nó có chạy hay không.
4. Phân dải rủi ro & quarantine skill
Mỗi khả năng có thể cài đặt — dù bạn đăng ký nó hay gateway tự phát hiện nó lúc runtime — đều được chạy qua skill scanner. Các phát hiện gộp lên thành một dải rủi ro và một chế độ thực thi:Dải rủi ro
Dải rủi ro
low · medium · high · critical. Dải được suy ra từ các lượt quét
tất định trên manifest và các phạm vi được khai báo (dùng tool chưa khai
báo, egress mạng ngoài các phạm vi đã duyệt, ghi filesystem không an
toàn, văn bản manifest có hình dạng injection).Chế độ thực thi
Chế độ thực thi
allow (các quy tắc chính sách của bạn quyết định), quarantine (bất kỳ
verdict không-deny nào leo thang thành pending_approval — một con người
duyệt mỗi cuộc gọi), block (buộc deny trên mọi tool của skill này bất
kể quy tắc). Một skill dải high quarantine tự động; critical block.Tại sao tự-phát-hiện = luôn bị quarantine
Tại sao tự-phát-hiện = luôn bị quarantine
Một khả năng mà một agent tự cài đặt, hoặc một tool mà một rug-pull thêm
vào, bị giữ trong
pending_approval bất kể điểm quét của nó cho đến khi
một con người xem xét nó. Một operator không thể lặng lẽ thêm một tool và
để các agent của bạn bắt đầu dùng nó.5. Allow-list egress — kiềm chế cú “gọi về nhà”
Hậu quả chuỗi cung ứng gây hại nhất là một dependency bị xâm phạm exfiltrate. Bề mặtegress của Firewall đánh giá đích đến đi ra ngoài
(host / IP / CIDR) mà một tool báo cáo, nên bạn có thể ghim nơi dữ liệu được
phép đi.
Bạn tự soạn một quy tắc egress: một allow-list host/CIDR với một
predicate cidr_match deny mọi thứ ngoài danh sách. Kết hợp nó với một
quy tắc trình tự phá vỡ chuỗi truy-xuất→egress, và một tool bị nhiễm độc
cố vận chuyển một tài liệu được truy xuất tới một host không xác định sẽ bị
deny tại gateway.
6. Credential được mã hóa — một server bị xâm phạm không thể đọc key của bạn
Các secret xác thực server được mã hóa khi nghỉ và tiêm bởi gateway lúc dispatch. Chúng không bao giờ đến mô hình, agent, hay các argument cuộc gọi tool — nên một server bị xâm phạm hoặc độc hại không thể exfiltrate các API key của bạn bằng cách đọc credential blob của chính nó. Console luôn trả về secret đã được mask — ngay cả với một Admin. Giá trị đã giải mã được trao ra trên đúng một con đường: một request mang một token có phạm vi firewall-gateway (một kiểu token chuyên dụng mà một Admin đúc tường minh cho gateway/proxy), nên một key relay bị rò rỉ thông thường không thể liệt kê các credential MCP của bạn.7. Tổng hợp cho một cuộc audit
Kiểm soát chuỗi cung ứng cũng là một artifact audit. OrcaRouter ánh xạ tới OWASP Top 10 cho Ứng dụng LLM — bao gồm kiểm soát LLM05 Supply Chain — như một phần của engine tuân thủ, song song với các framework nhưsoc2,
iso_27001, iso_42001, nist_ai_rmf, và eu_ai_act.
Cài đặt một compliance pack
(POST /api/compliance/packs/:key/install, workspace Admin, gói trả
phí) hiện thực hóa các guardrail và chính sách firewall khớp và bắt đầu ở một
tư thế observe-first. Các báo cáo tuân thủ bao gồm một mục bằng chứng
chuỗi-cung-ứng-AI — các provider thượng nguồn mà workspace của bạn thực sự
định tuyến tới, cộng với một xem xét truy cập đặc quyền và vệ sinh key — và
được ký Ed25519 và xác minh công khai được. Duyệt catalog và sự sẵn sàng là
miễn phí cho mọi Member; xem Compliance
để biết toàn bộ vòng đời.
Kiểm soát MCP là hai lớp bổ trợ: đánh giá firewall theo từng cuộc gọi trên
bề mặt
mcp (thực thi trên những gì một dependency làm), cộng với một
baseline toàn vẹn tool-schema (hash trust-on-first-use của tập tool được
quảng bá, kiểm tra lại trên mỗi probe — drift lật schema_status của server
sang changed và fail dispatch closed cho đến khi một admin tạo baseline lại
hoặc quarantine nó). Cùng với phân dải rủi ro skill và quarantine, đó là thực
thi trên cả những gì một dependency làm và một bản ghi xác minh được về những
gì nó đã khai báo.8. Một baseline chuỗi cung ứng
Trước khi bạn tin tưởng một MCP server hoặc skill mới
Trước khi bạn tin tưởng một MCP server hoặc skill mới
Đăng ký nó, probe tập tool của nó, và giới hạn một quy tắc
<server>.*
thành pending_approval hoặc audit. Đọc các phát hiện quét — bất kỳ
phát hiện tool-chưa-khai-báo hoặc egress-bên-ngoài nào là một lý do để
giữ nó quarantine. Xác minh ai kiểm soát URL endpoint.Ở trạng thái ổn định
Ở trạng thái ổn định
Giữ một allow-list egress được ghim cho bất kỳ agent nào có tool
fetch/search/export. Theo dõi chế độ xem
Discovered tools tìm các khả năng xuất hiện mà
không có quy tắc, và feed bất thường tìm các đường tool-sang-tool mới lạ.
Sau một nghi ngờ rug-pull
Sau một nghi ngờ rug-pull
Vô hiệu hóa server (
PUT .../mcp_servers, "enabled": false) — các
credential của nó không bao giờ được giải mã khi bị vô hiệu hóa. Probe
lại để lộ diện các tool mới, quét lại skill, và xem xét hàng đợi
pending_approval thay vì duyệt hàng loạt.9. Mối đe dọa & khái niệm liên quan
- Nhiễm độc tool MCP & rug-pull — phần đào sâu về các MCP server độc hại và bị cướp quyền.
- Rò rỉ dữ liệu — các quy tắc egress giới hạn nơi các cuộc gọi tool có thể gửi dữ liệu.
- Cuộc gọi tool nguy hiểm — block các hành động phá hủy bất kể tool đến từ đâu.
- Rò rỉ secret — giữ credential ra khỏi prompt, argument, và log.
- Bảo mật AI agent và control stack — cách các kiểm soát này khớp vào tư thế rộng hơn.
Firewall: MCP Server
Đăng ký các MCP server đằng sau gateway, probe các tool của chúng, và áp
dụng một verdict theo từng cuộc gọi trước khi bất kỳ cuộc gọi nào đến
server thật.
Firewall: Skills
Quét và chấm điểm rủi ro mọi khả năng có thể cài đặt. Quarantine hoặc
block các skill rủi ro trước khi các tool của chúng chạy.
