1. Logging quyền riêng tư guardrail: mặc định tắt
Mỗi guardrail mang một công tắc theo-từng-chính-sách duy nhất, Log raw content, và nó được phát hành tắt. Với nó tắt, một match ghi lại metadata của cái đã kích hoạt nhưng không bao giờ sao chép văn bản vi phạm vào feed:Được ghi với công tắc TẮT
Loại quy tắc, hành động, giai đoạn, và một chuỗi chi tiết ngắn — đủ để
biết một quy tắc
pii đã che một email trên request, mà không lưu
địa chỉ.Chỉ thêm khi BẬT
(Các) chuỗi con đã match — văn bản literal mà quy tắc bắt. Chỉ
được bắt cho các match được ghi lại sau khi bạn bật công tắc.
Mặc định tắt là lập trường bảo thủ về quyền riêng tư. Chuỗi con đã
match là thứ nhạy cảm nhất mà một guardrail có thể log — nó, theo định
nghĩa, là dữ liệu mà quy tắc tồn tại để bắt. OrcaRouter không lưu nó trừ
khi bạn opt in cho từng guardrail.
2. Một bản ghi match giữ cái gì
Một match là một bản ghi chẩn đoán nhỏ, theo phạm vi workspace. Với Log raw content tắt, nó chỉ mang metadata:| Trường | Ví dụ | Có khi công tắc tắt? |
|---|---|---|
| Loại quy tắc | pii, regex, keyword | Có |
| Hành động | block, mask, flag | Có |
| Giai đoạn | input, output | Có |
| Detail | chuỗi phân loại ngắn (ví dụ entity) | Có |
| Chuỗi con đã match | jane@acme.com | Chỉ khi BẬT |
3. Một ví dụ cụ thể
Lấy một guardrail với một quy tắcpii che email trên request, được
gắn vào một key. Một người gọi gửi:
[EMAIL] trước khi mô hình thấy nó, và một
match đáp xuống feed. Cái match đó chứa gì phụ thuộc hoàn toàn vào công
tắc:
Log raw content TẮT (mặc định)
Log raw content TẮT (mặc định)
Match ghi lại: loại quy tắc
pii, hành động mask, giai đoạn input,
và một chuỗi chi tiết nêu tên entity email. Nó không lưu
jane@acme.com. Bạn biết một email đã được che trên request; bạn không
thể đọc email ra khỏi feed.Log raw content BẬT
Log raw content BẬT
Cùng match thêm vào mang theo chuỗi con đã match —
jane@acme.com —
nên bạn có thể xác nhận chính xác cái quy tắc bắt trong một lượt phân
loại.4. Bật nó (và đảm bảo không-hồi-tố)
Log raw content là một cài đặt theo-từng-guardrail. Chỉnh sửa một guardrail là một hành động console dưới phiên của riêng bạn và yêu cầu Developer+ trong workspace — chỉ cuộc gọi/v1/* cuối cùng dùng
một relay key sk-orca-....
Bật Log raw content
Bật công tắc Log raw content và lưu. Lưu viết một hàng lịch sử có
phiên bản, nên thay đổi có thể audit và revert được — xem
Versioning.
5. Cái gì được bắt khi nó bật
Khi Log raw content bật, engine gắn văn bản đã match literal vào mỗi vi phạm, với hai giới hạn cứng giữ một input bệnh lý khỏi làm phình một bản ghi match đơn:- Tối đa 32 mục đã match cho mỗi vi phạm.
- Mỗi mục được giới hạn ở 256 ký tự.
Ngay cả với công tắc bật, một guardrail chỉ từng ghi lại văn bản mà một
quy tắc thực sự match. Prompt xung quanh và phần còn lại của phản hồi
không bao giờ được sao chép vào Matches feed. Toàn bộ payload
request/response là một mối quan tâm riêng biệt với chẩn đoán guardrail.
6. Loại bỏ chuỗi con bạn đã bắt
Vì công tắc không hồi tố, tắt nó để các chuỗi con trước đó tại chỗ. Hai bề mặt xóa chúng:| Muốn loại bỏ | Cách |
|---|---|
| Một match nhiễu | Đánh dấu nó một dương tính giả — POST /api/guardrail/match/:id/mark-fp (Admin workspace), hoặc hành động Mark false positive trong feed. |
| Mọi match guardrail cho một người dùng | Một lần tự-xóa của người dùng kích hoạt một cửa sổ ân hạn 30 ngày, rồi một lần chà PII cascade qua các match guardrail, request log, và sự kiện firewall. Xem Compliance. |
7. Ai có thể đọc gì
Matches feed là dữ liệu chẩn đoán theo phạm vi workspace. Quyền đọc mở cho mọi member đang hoạt động; hành động dương-tính-giả hủy hoại được gate cao hơn:| Hành động | Route | Vai trò |
|---|---|---|
| Liệt kê / nhóm / thống kê / export match | GET /api/guardrail/match* | Member |
| Chi tiết match đơn | GET /api/guardrail/match/:id | Member |
| Đánh dấu / bỏ đánh dấu dương tính giả | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| Chỉnh sửa một guardrail (gồm Log raw content) | PUT /api/guardrail/ | Developer+ |
8. Một mặc định quyền riêng tư thực dụng
Đối với hầu hết workspace, hình dạng đúng là: để Log raw content tắt, chạy guardrails của bạn trên metadata, và lật công tắc lên tạm thời cho một chính sách đơn khi bạn đang tích cực debug tại sao một quy tắc kích hoạt theo cách của nó. Rồi lật lại tắt — các match mới dừng mang chuỗi con ngay lập tức.9. Đi đâu tiếp theo
Matches feed
Duyệt, nhóm, lọc, và export mọi match được ghi lại.
Tinh chỉnh dương tính giả
Đánh dấu và tinh lọc các match để làm im một quy tắc nhiễu.
Versioning
Mỗi lần lật công tắc là một thay đổi có phiên bản, revert được.
Compliance
Lưu giữ, xóa dữ liệu chủ thể, và các báo cáo đã ký.
