Chuyển đến nội dung chính
Khi một quy tắc guardrail kích hoạt, OrcaRouter ghi lại một match để bạn có thể thấy cái gì đã kích hoạt và bao lâu một lần. Câu hỏi quyền riêng tư là câu mà trang này trả lời: bản ghi đó có chứa văn bản nhạy cảm thực tế không — email thực, SSN, API key — hay chỉ sự thật rằng một quy tắc đã match? Theo mặc định nó chứa chỉ sự thật. Logging quyền riêng tư guardrail trên gateway được lưu trữ bảo thủ một cách có chủ đích: chuỗi con đã match không được lưu trừ khi bạn rõ ràng bật Log raw content cho guardrail đó, và lật công tắc không bao giờ vươn ngược qua dữ liệu bạn đã ghi. Đây là trang đích tập trung cho lập trường quyền riêng tư của Matches feed. Về bản thân feed — duyệt, nhóm, export — xem Matches feed. Về engine đầy đủ, xem tài liệu tham khảo Guardrails.

1. Logging quyền riêng tư guardrail: mặc định tắt

Mỗi guardrail mang một công tắc theo-từng-chính-sách duy nhất, Log raw content, và nó được phát hành tắt. Với nó tắt, một match ghi lại metadata của cái đã kích hoạt nhưng không bao giờ sao chép văn bản vi phạm vào feed:

Được ghi với công tắc TẮT

Loại quy tắc, hành động, giai đoạn, và một chuỗi chi tiết ngắn — đủ để biết một quy tắc pii đã che một email trên request, mà không lưu địa chỉ.

Chỉ thêm khi BẬT

(Các) chuỗi con đã match — văn bản literal mà quy tắc bắt. Chỉ được bắt cho các match được ghi lại sau khi bạn bật công tắc.
Lý do là cái mà hầu hết các đội tuân thủ muốn theo mặc định: bạn học được rằng một SSN đã xuất hiện trong traffic của bạn và cách chính sách xử lý nó, mà không sao chép dữ liệu được quản chế ra khỏi request và vào kho chẩn đoán của riêng bạn.
Mặc định tắt là lập trường bảo thủ về quyền riêng tư. Chuỗi con đã match là thứ nhạy cảm nhất mà một guardrail có thể log — nó, theo định nghĩa, là dữ liệu mà quy tắc tồn tại để bắt. OrcaRouter không lưu nó trừ khi bạn opt in cho từng guardrail.

2. Một bản ghi match giữ cái gì

Một match là một bản ghi chẩn đoán nhỏ, theo phạm vi workspace. Với Log raw content tắt, nó chỉ mang metadata:
TrườngVí dụCó khi công tắc tắt?
Loại quy tắcpii, regex, keyword
Hành độngblock, mask, flag
Giai đoạninput, output
Detailchuỗi phân loại ngắn (ví dụ entity)
Chuỗi con đã matchjane@acme.comChỉ khi BẬT
Trường chuỗi-con-đã-match là thứ duy nhất mà công tắc gate. Mọi thứ khác được ghi lại dù cách nào, nên feed hữu ích cho phân tích khối lượng, xu hướng, và hỗn hợp hành động ngay cả với raw content tắt.
Bạn có thể chạy cả một chương trình quan-sát-hay-thực-thi — thấy nơi PII đi vào, quy tắc nào kích hoạt nhiều nhất, liệu một chính sách có nhiễu — hoàn toàn trên metadata. Bật chuỗi con chỉ cho cửa sổ hẹp nơi bạn cần xem chính xác cái gì đã match trong khi phân loại.

3. Một ví dụ cụ thể

Lấy một guardrail với một quy tắc pii che email trên request, được gắn vào một key. Một người gọi gửi:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
Quy tắc che địa chỉ thành [EMAIL] trước khi mô hình thấy nó, và một match đáp xuống feed. Cái match đó chứa gì phụ thuộc hoàn toàn vào công tắc:
Match ghi lại: loại quy tắc pii, hành động mask, giai đoạn input, và một chuỗi chi tiết nêu tên entity email. Nó không lưu jane@acme.com. Bạn biết một email đã được che trên request; bạn không thể đọc email ra khỏi feed.
Cùng match thêm vào mang theo chuỗi con đã match — jane@acme.com — nên bạn có thể xác nhận chính xác cái quy tắc bắt trong một lượt phân loại.
Bản thân request giống hệt trong cả hai trường hợp. Công tắc chỉ thay đổi cái feed chẩn đoán giữ lại, không bao giờ cái người gọi hoặc mô hình thượng nguồn trải nghiệm.

4. Bật nó (và đảm bảo không-hồi-tố)

Log raw content là một cài đặt theo-từng-guardrail. Chỉnh sửa một guardrail là một hành động console dưới phiên của riêng bạn và yêu cầu Developer+ trong workspace — chỉ cuộc gọi /v1/* cuối cùng dùng một relay key sk-orca-....
1

Mở guardrail

Trong console, mở Guardrails và chỉnh sửa chính sách bạn muốn bắt chuỗi con cho.
2

Bật Log raw content

Bật công tắc Log raw content và lưu. Lưu viết một hàng lịch sử có phiên bản, nên thay đổi có thể audit và revert được — xem Versioning.
3

Bắt bắt đầu từ đây trở đi

Từ request kế tiếp trở đi, các match trên guardrail này bao gồm chuỗi con đã match. Các match được ghi lại trước khi bạn lật công tắc giữ chỉ-metadata.
Công tắc không hồi tố — cả hai hướng. Bật nó lên không điền lại chuỗi con lên các match bạn đã log; những bản ghi cũ đó giữ chỉ-metadata mãi mãi. Tắt nó xuống dừng bắt các chuỗi con mới nhưng không xóa các chuỗi con đã lưu trên các match quá khứ. Nếu bạn cần chúng biến mất, xem §6.

5. Cái gì được bắt khi nó bật

Khi Log raw content bật, engine gắn văn bản đã match literal vào mỗi vi phạm, với hai giới hạn cứng giữ một input bệnh lý khỏi làm phình một bản ghi match đơn:
  • Tối đa 32 mục đã match cho mỗi vi phạm.
  • Mỗi mục được giới hạn ở 256 ký tự.
Nên một guardrail kích hoạt trên một tài liệu khổng lồ lưu một mẫu có giới hạn, đại diện của cái đã match — không phải toàn bộ body. Chuỗi detail cũng được kẹp độ dài độc lập. Các giới hạn này tồn tại cho vệ sinh lưu trữ; coi bộ đã bắt như bằng chứng của cái gì đã match, không phải một bản ghi nguyên văn của toàn bộ request.
Ngay cả với công tắc bật, một guardrail chỉ từng ghi lại văn bản mà một quy tắc thực sự match. Prompt xung quanh và phần còn lại của phản hồi không bao giờ được sao chép vào Matches feed. Toàn bộ payload request/response là một mối quan tâm riêng biệt với chẩn đoán guardrail.

6. Loại bỏ chuỗi con bạn đã bắt

Vì công tắc không hồi tố, tắt nó để các chuỗi con trước đó tại chỗ. Hai bề mặt xóa chúng:
Muốn loại bỏCách
Một match nhiễuĐánh dấu nó một dương tính giả — POST /api/guardrail/match/:id/mark-fp (Admin workspace), hoặc hành động Mark false positive trong feed.
Mọi match guardrail cho một người dùngMột lần tự-xóa của người dùng kích hoạt một cửa sổ ân hạn 30 ngày, rồi một lần chà PII cascade qua các match guardrail, request log, và sự kiện firewall. Xem Compliance.
Để tinh chỉnh một quy tắc lắm lời thay vì chà dữ liệu, luồng Tinh chỉnh dương tính giả đi qua đánh dấu và tinh lọc các match.

7. Ai có thể đọc gì

Matches feed là dữ liệu chẩn đoán theo phạm vi workspace. Quyền đọc mở cho mọi member đang hoạt động; hành động dương-tính-giả hủy hoại được gate cao hơn:
Hành độngRouteVai trò
Liệt kê / nhóm / thống kê / export matchGET /api/guardrail/match*Member
Chi tiết match đơnGET /api/guardrail/match/:idMember
Đánh dấu / bỏ đánh dấu dương tính giảPOST / DELETE /api/guardrail/match/:id/mark-fpAdmin
Chỉnh sửa một guardrail (gồm Log raw content)PUT /api/guardrail/Developer+
Các route quản lý này xác thực với session console của bạn, không phải một relay key. Các thao tác đọc không bao giờ phơi bày một chuỗi con mà công tắc không bắt — không có gì thêm để redact lúc đọc, vì không có gì thêm được lưu.

8. Một mặc định quyền riêng tư thực dụng

Đối với hầu hết workspace, hình dạng đúng là: để Log raw content tắt, chạy guardrails của bạn trên metadata, và lật công tắc lên tạm thời cho một chính sách đơn khi bạn đang tích cực debug tại sao một quy tắc kích hoạt theo cách của nó. Rồi lật lại tắt — các match mới dừng mang chuỗi con ngay lập tức.
Cái này ghép tự nhiên với một lần triển khai chỉ-quan-sát. Bắt đầu với Compliance Logger (chỉ-flag), theo dõi Matches feed trên metadata, và chỉ dùng tới raw content nếu một match cụ thể cần xem kỹ hơn.

9. Đi đâu tiếp theo

Matches feed

Duyệt, nhóm, lọc, và export mọi match được ghi lại.

Tinh chỉnh dương tính giả

Đánh dấu và tinh lọc các match để làm im một quy tắc nhiễu.

Versioning

Mỗi lần lật công tắc là một thay đổi có phiên bản, revert được.

Compliance

Lưu giữ, xóa dữ liệu chủ thể, và các báo cáo đã ký.
Về cách cái này phù hợp control stack rộng hơn, xem Guardrails so với firewallData exfiltration. Về engine hoàn chỉnh — giai đoạn, quy tắc nâng cao, và route — đọc tài liệu tham khảo Guardrails.