db.query vào 3 giờ sáng Chủ Nhật, một agent đập một
tool đang fail trong một vòng lặp chật, một bước nhảy tool-tới-tool mà workspace
này chưa bao giờ làm. Mỗi cuộc gọi qua mọi quy tắc; mẫu mới là vấn đề.
Phát hiện bất thường firewall là lớp hành vi. Gateway học hình dạng dùng
tool bình thường của workspace bạn và chấm điểm hoạt động live trên đó, làm hiện
các lệch trên một feed mà bất kỳ Member nào có thể đọc. Đó là cách bạn để ý
một agent bị xâm phạm hoặc một vòng lặp chạy hoang mà không cần đã viết-trước một
quy tắc cho một hình dạng bạn chưa từng thấy. Trang này là điểm đáp tập trung
cho feed phát hiện bất thường firewall đó;
tổng quan Firewall là tham chiếu
sâu.
Feed bất thường là phát hiện, không phải thực thi. Nó cho bạn biết cái gì
trông lệch — nó không block. Khi một mẫu là thật, bạn biến nó thành một
quy tắc hoặc một
verdict giới-hạn-tốc-độ để lần xuất hiện kế
tiếp bị dừng inline. Đọc feed mở cho mọi Member; biến một phát hiện thành chính
sách là Developer+.
1. Phát hiện bất thường firewall gắn cờ gì
Bốn loại tín hiệu, mỗi cái gắn với một chế độ thất bại khác nhau:rate_spike — quá nhiều cuộc gọi cho giờ này
rate_spike — quá nhiều cuộc gọi cho giờ này
Khối lượng cuộc gọi theo-tool chấm điểm trên một baseline
giờ-trong-tuần đã học. Một tool kích hoạt
rate_spike khi số đếm của
nó vượt một sàn tuyệt đối và chạy cao so với baseline cho giờ đó, hoặc
khi z-score của nó vượt ngưỡng. Khóa theo giờ-trong-tuần (không phải
giờ-trong-ngày) nghĩa là Thứ Ba-14:00 được so với các Thứ Ba-14:00 trong
quá khứ, nên traffic đỉnh-ngày-thường hợp lệ không đọc như một đột biến
trong khi cùng khối lượng vào 3 giờ sáng Chủ Nhật thì có.burn_spike — chi phí chạy nóng so với baseline
burn_spike — chi phí chạy nóng so với baseline
Cùng so sánh giờ-trong-tuần, áp dụng cho chi phí tích lũy thay vì số
đếm cuộc gọi. Một tool mà chi tiêu chạy vượt xa mức chi-phí đã học của nó
hiện ra như một
burn_spike — tín hiệu cảnh-báo-sớm cho một agent đắt tiền
trước khi nó phá hủy.retry_loop — cùng cuộc gọi, lặp đi lặp lại
retry_loop — cùng cuộc gọi, lặp đi lặp lại
Một nhóm
(conversation, tool, arguments) lặp lại nhiều lần trong một cửa
sổ ngắn — một agent kẹt phát lại cùng cuộc gọi tool đang fail thay vì hồi
phục. Polling chậm, hợp lệ không vấp nó; tín hiệu là một vòng lặp chật.novel_path — một chuyển tiếp chưa bao giờ thấy
novel_path — một chuyển tiếp chưa bao giờ thấy
Một chuyển tiếp liên tiếp
tool_a → tool_b mà workspace này không có
baseline đã học. Lần đầu một agent đi, chẳng hạn, crm.read → http.fetch,
cạnh đó là mới lạ — đúng kiểu bước mà một chuỗi
rò-rỉ-dữ-liệu thực hiện.2. Baseline 14 ngày
Bộ phát hiện không phải một ngưỡng cố định — nó là một mức bình thường đã học. Với mỗi bucket(tool, hour-of-week) gateway giữ một số-đếm-cuộc-gọi và chi
phí kỳ vọng trượt, backfill từ một lookback 14 ngày (khoảng hai lần xuất
hiện của mỗi bucket giờ-trong-tuần — đủ để làm mượt một ngày lẻ mà không mất
hình dạng hàng tuần). novel_path dùng baseline chuyển tiếp song song: số đếm
xuất hiện đã học cho mỗi cạnh tool_a → tool_b trong giờ-trong-tuần đó.
Một workspace hoàn toàn mới chưa có baseline. Không sao: không có mức bình
thường đã học, các bộ phát hiện khối lượng rơi về một sàn tuyệt đối, nên một
cơn lũ hiển nhiên vẫn bị bắt vào ngày đầu trong khi các mức bình thường
theo-giờ điền vào.
| Tín hiệu | Học từ cái gì |
|---|---|
rate_spike / burn_spike | Số đếm và chi phí theo-(tool, hour-of-week), trượt 14 ngày. |
novel_path | Số đếm chuyển tiếp theo-(tool_a → tool_b, hour-of-week). |
retry_loop | Không baseline — một ngưỡng lặp theo-cửa-sổ trên (conversation, tool, args). |
Feed báo cáo chỉ tên tool, token id đã che, và số đếm. Một API-key id thô
không bao giờ xuất hiện — mỗi item mang một digest một-chiều của token đang gọi,
nên bạn có thể phân biệt hai bất thường mà feed không bao giờ rò rỉ key đằng sau
chúng.
3. Một lần đọc cụ thể
Giả sử một agent key bắt đầu loop. Kéo feed trong console dưới Security → Firewall → Anomalies, hoặc đọc nó trực tiếp — bất kỳ Member nào cũng có thể:retry_loop không mang baseline hay z_score (các trường đó ở lại
0 — chúng thuộc về các bộ phát hiện khối-lượng/chi-phí), và nó mang một id
mờ ổn định nên hai loop riêng biệt trên cùng tool không va chạm trên một dòng.
Một rate_spike thì ngược lại: nó báo cáo một baseline đã học và một
z_score, và để id trống.
Mỗi item nêu tên tool, token đã che, bao nhiêu cuộc gọi đã kích hoạt, z-score
(chỉ tín hiệu khối-lượng/chi-phí), và một suggested_action (rate_limit,
block_tool, hoặc review). Từ đây bạn hành động: thả một
quy tắc deny trên tool,
kiểm tra đối số của nó, hoặc mở
events log để thấy chính xác agent đã làm
gì.
4. Snooze feed
Một load test đã biết hoặc một backfill đã lên kế hoạch sẽ làm feed sáng lên. Thay vì đuổi theo nhiễu, hãy snooze nó — tối đa 7 ngày:snoozed_until; nó tự xóa ngay khi deadline qua. Cap là một trần cứng — một
until gõ-nhầm hay thù địch xa hơn bị clamp nên phát hiện bất thường không thể
bị làm câm vô thời hạn. POST một until quá-khứ hoặc bây-giờ xóa một snooze
hiện có.
Đọc feed là một hành động Member; snooze nó là Developer+ — làm câm
một tín hiệu an toàn toàn-workspace là một thao tác ghi, không phải một đọc.
5. RBAC trong nháy mắt
Bề mặt analytics chia theo ranh giới đọc/hành-động thông thường:| Hành động | Vai trò |
|---|---|
| Đọc feed bất thường | Member |
| Đọc cài đặt, chính sách, discovered tools | Member |
| Snooze feed | Developer+ |
| Events, runs, aggregate, trace | Developer+ |
| Soạn một quy tắc từ một phát hiện | Developer+ |
6. Từ tín hiệu tới chính sách
Feed là khởi đầu của một vòng lặp, không phải kết thúc:Phát hiện mẫu
Một
novel_path hoặc rate_spike cho thấy một hình dạng bạn không mong
đợi. Đọc nó trên events log để xác nhận
nó là thật, không phải một-lần.Viết quy tắc
Biến phát hiện thành thực thi — một block,
một mệnh đề argument, một
quy tắc chuỗi cho chuỗi, hoặc một
cap chi phí cho lần đốt.
Triển khai nó an toàn
Đáp quy tắc dưới shadow mode trước để
bạn đo bán kính tác động của nó trước khi nó block một cuộc gọi nào, rồi
thực thi.
Đi đâu tiếp theo
Tổng quan Firewall
Tham chiếu phát-hiện-bất-thường đầy đủ và phần còn lại của mặt phẳng chính
sách.
Events log
Đào từ một bất thường vào các cuộc gọi chính xác đằng sau nó.
Block một tool
Biến một phát hiện thành một quy tắc thực thi.
Chế độ thực thi
Cách phát hiện, audit, shadow, và thực thi khớp với nhau.
