api.orcarouter.ai: một
verdict mặc định deny cộng một hoặc nhiều quy tắc allow khóa trên một
tool_name_glob. Để biết toàn bộ ngôn
ngữ so khớp đằng sau những quy tắc đó, xem
Quy tắc Firewall.
Allow-list được soạn trong console dưới Security → Firewall, hoặc qua
các route quản lý
/api/workspace/firewall/* (session / access token của bạn
— không phải một relay key sk-orca-…). Chỉ các cuộc gọi /v1/* của
agent bạn dùng relay key. Tạo hoặc chỉnh sửa một chính sách là một hành động
Developer+.1. Tại sao default-deny cho agent
Một block-list (“denyshell.exec, deny db.delete, …”) chỉ đầy đủ đến mức
mối đe dọa cuối cùng bạn nghĩ ra. Một allow-list đảo ngược gánh nặng chứng
minh: gateway deny mọi thứ mà chính sách không tường minh cho phép, nên một
tool chưa biết bị đóng theo cấu trúc.
Verdict mặc định = deny
Sàn của chính sách. Không quy tắc nào khớp thì mọi cuộc gọi tool đều bị
block.
Quy tắc allow đưa tool quay lại
Mỗi quy tắc
allow nêu tên các tool bạn thực sự dùng — theo tên chính xác
hoặc theo glob.default_verdict của chính
sách. Vậy một allow-list chỉ là: các quy tắc allow ưu tiên cao cho các tool
thực của bạn, với một sàn deny bắt mọi thứ còn lại.
2. Một ví dụ: allow-list các tool của một agent nghiên cứu
Giả sử agent của bạn chỉ cần tìm kiếm web và đọc từ một knowledge base — các tool tênweb.search và kb.read. Mọi thứ khác (shell, ghi file, mutation
cơ sở dữ liệu, bất kỳ tool nào mà một prompt-injection có thể triệu hồi) phải
bị deny.
Xây chính sách thành mặc định deny + hai quy tắc allow:
Tạo chính sách với mặc định deny
Security → Firewall → Policies → New policy. Đặt tên, để Enabled
bật, và đặt verdict mặc định thành
deny. Đây là sàn đóng — xem
Tạo một chính sách.Thêm một quy tắc allow cho mỗi họ tool
Trong trình chỉnh sửa quy tắc, thêm hai quy tắc, cả hai
verdict = allow:priority | tool_name_glob | verdict |
|---|---|---|
10 | web.search | allow |
20 | kb.* | allow |
web.search là một match chính xác; kb.* là một prefix glob cho
phép kb.read, kb.search, và bất kỳ tool kb.* nào trong tương lai mà
không cần chỉnh sửa lại chính sách.web.search và kb.read đi qua; một cuộc gọi tới shell.exec không khớp
quy tắc allow nào, chạm sàn deny, và quay lại dưới dạng HTTP 400 với mã
firewall_blocked trên bề mặt inbound — xem
một block trông như thế nào.
3. Glob trong một màn hình
tool_name_glob là một ngữ pháp nhỏ, phân biệt hoa-thường — không regex,
thời gian tuyến tính. Các hình dạng quan trọng cho một allow-list:
| Mẫu | Cho phép |
|---|---|
web.search | Đúng tool đó. |
kb.* | Tiền tố — kb.read, kb.search (không phải kb trần). |
*.search | Hậu tố — web.search, kb.search, và search trần. |
*.tools.* | Trung tố — byo.tools.fetch và tương tự. |
4. Triển khai nó mà không làm hỏng agent
Default-deny là tư thế dễ block nhất một tool bạn quên là mình cần. Hãy phân giai đoạn nó:Đưa vào shadow trước
Đưa vào shadow trước
Bật shadow mode. Chính sách đánh giá
và ghi log đúng như nó sẽ làm khi live, nhưng hạ cấp mọi deny thành
audit với lý do được thêm tiền tố [shadow] would …. Chạy traffic
thật, rồi đọc events feed.Tìm các tool bạn thực sự gọi
Tìm các tool bạn thực sự gọi
Discovered tools liệt kê mọi tool mà
workspace đã thấy, gắn cờ covered hoặc gap. Các event
“would-deny” của shadow mode cộng với các gap cho bạn biết chính xác bạn
còn cần các quy tắc allow nào.
Test trước khi thực thi
Test trước khi thực thi
Test sandbox chạy thử chính sách trên
một cuộc gọi tool mẫu và trả về verdict, quy tắc đã khớp, và lý do —
không dispatch gì, không lưu gì. Xác nhận
web.search allow và
shell.exec deny, rồi tắt shadow.Một cuộc gọi inbound bị deny tốn không token mô hình nào — nó bị block
trước khi mô hình thượng nguồn chạy — và được đánh dấu skip-retry, nên
một tool bị block sẽ không đốt một ngân sách retry để bị block lại. Xem
Verdict.
5. Đi đâu tiếp theo
Block các tool cụ thể
Mặt ngược lại — giữ một sàn default-allow và deny các tool có tên.
Kiểm tra đối số
Allow một tool, nhưng chỉ với đối số an toàn (
db.query nhưng không
DROP TABLE).Ưu tiên quy tắc
Cách first-match-wins sắp các quy tắc allow của bạn trên sàn deny.
Verdict
allow, audit, deny, sanitize, pending_approval, cap_cost.
