1. Tại sao gateway là điểm kiểm tra đúng
Hầu hết các kiểm soát bảo mật nằm trong ứng dụng: library wrapper, agent framework hook, per-provider SDK. Các kiểm soát đó có một lỗ hổng cấu trúc nghiêm trọng — chúng phá vỡ ngay khi bạn thêm provider thứ hai, đổi framework, hoặc để agent tự cài đặt một skill mới. Gateway không có những đường nối đó. Mọi cuộc gọi mà agent của bạn phát ra, bất kể mô hình, provider, hoặc khả năng tool đến như thế nào, đều transit qua một điểm duy nhất trước khi bất kỳ thứ gì đến được thượng nguồn. Đó là lớp duy nhất nơi bạn có thể đưa ra đảm bảo: nếu nó xảy ra, gateway đã thấy nó. OrcaRouter sử dụng vị trí đó cho hai lượt thực thi riêng biệt:- Guardrails sàng lọc văn bản — prompt mà agent của bạn gửi và phản
hồi mà mô hình trả về. Một guardrail block trả về HTTP 400
guardrail_blockedvà không tốn quota. - Firewall phán xét hành động — các tool mà agent gọi, các MCP
server nó kết nối, và các đích đến mạng nó báo cáo. Một firewall deny
trả về HTTP 400
firewall_blockedtrên bề mặt inbound, hoặc lỗi tool trên bề mặt MCP, để mô hình thấy sự từ chối và có thể lý luận về nó.
https://api.orcarouter.ai/v1 như trước.
2. Bốn bề mặt thực thi
Firewall đánh giá mọi lời gọi tool đối với đúng một bề mặt — điểm trong vòng đời cuộc gọi nơi gateway thấy nó.| Bề mặt | Những gì gateway thấy |
|---|---|
inbound | Các tool mà agent của bạn quảng bá cho mô hình trên request — định nghĩa tool. Chặn ở đây ngăn mô hình không bao giờ chọn một tool nguy hiểm. |
response | Các tool_calls mà mô hình phát ra trong phản hồi của nó — các hành động đã chọn của mô hình trước khi chúng được dispatch. |
mcp | Một tools/call được dispatch qua Firewall MCP gateway hoặc được đánh giá qua SDK hook — cuộc gọi tại thời điểm dispatch. |
egress | Một đích đến mạng đi ra ngoài (host / IP / CIDR) mà một tool báo cáo — bề mặt SSRF và data-exfiltration. |
input (prompt và message request) và output (văn bản
phản hồi của mô hình). Một request có thể đi qua tất cả chúng.
3. Phát hiện lần dùng đầu tiên
Phát hiện xảy ra tại gateway, lần dùng đầu tiên — không phải lúc cài
đặt. Một tool, MCP server, hoặc skill mà agent tự cài đặt được bắt
lần đầu tiên cuộc gọi của nó vượt qua gateway. Đây là chủ đích: gateway
là điểm nghẽn duy nhất thấy mọi provider, mọi agent, và mọi cuộc gọi
bất kể khả năng đến từ đâu. Chờ phát hiện lúc cài đặt sẽ bỏ lỡ các
khả năng được nạp lúc runtime.
4. Những gì gateway không thể thấy
Đảm bảo kiểm tra bao gồm các cuộc gọi vượt qua gateway. Nó không mở rộng đến một tool mà agent của bạn chạy hoàn toàn bên trong tiến trình của chính nó — một cái đọc file local, gọi library function, hoặc thực thi subprocess mà không bao giờ gửi message đến gateway. Đó là một ranh giới trung thực, không phải lỗi thiết kế. Mục tiêu thiết kế là làm cho gateway trở thành con đường được audit cho các cuộc gọi quan trọng — những cuộc gọi có hậu quả ngoài đời thực:| Nơi nó chạy | Gateway thấy nó không? | Cách đóng khoảng trống |
|---|---|---|
Lời gọi tool qua trung gian mô hình (mô hình phát ra tool_calls) | Có — bề mặt response | Không cần hành động; đã được quản lý. |
| MCP dispatch qua Firewall MCP gateway | Có — bề mặt mcp | Không cần hành động; đã được quản lý. |
Agent của bạn gọi POST /api/v1/firewall/evaluate trước khi dispatch | Có — được đánh giá inline | Đã được quản lý qua evaluate hook. |
| Tool chạy in-process, không tiếp xúc gateway | Không | Định tuyến MCP dispatch và các tool gọi mạng qua gateway thay vì gọi chúng trực tiếp từ tiến trình agent. |
5. Kiểm soát vai trò trên dữ liệu kiểm tra
Quyền truy cập vào các bề mặt kiểm tra được giới hạn theo vai trò trong workspace của bạn:| Khả năng | Vai trò tối thiểu |
|---|---|
| Đọc guardrail match, chính sách firewall & discovered tool | Member |
| Đọc feed Events & Runs của firewall | Developer |
| Tạo hoặc thay đổi guardrails, chính sách firewall, quy tắc | Developer |
Xuất compliance, plaintext firewall-gateway-scoped key, flag is_firewall_gateway | Admin |
Một token có phạm vi firewall-gateway (key dùng để gọi
/api/v1/firewall/evaluate và MCP gateway) yêu cầu vai trò Admin để
tạo. Một API key thông thường nhận 403 trên các route đó.6. Tiếp theo
Control stack
Đường đi request đầy đủ — key, guardrail, mô hình, firewall, audit
— trong một sơ đồ.
Trách nhiệm chung
Những gì gateway bảo mật và những gì nằm trong ứng dụng của bạn.
Agent Firewall
Soạn chính sách, cấu hình bề mặt, và quản lý lời gọi tool chuyên
sâu.
