Chuyển đến nội dung chính
Bạn muốn giữ dữ liệu cá nhân khỏi mô hình thượng nguồn. Một khách hàng dán một địa chỉ email, một bản ghi hỗ trợ mang theo số thẻ, một prompt agent rò rỉ một SSN — và không có cái nào trong số đó nên đến OpenAI, Anthropic, hay Google ở dạng rõ. PII Shield là cách nhanh nhất để sửa điều đó: một preset guardrail một-quy-tắc phát hiện các entity nhạy cảm trong request và che mỗi cái thành một thẻ có kiểu trước khi gateway chuyển tiếp cuộc gọi. Đây là trang đích tập trung cho trường hợp dùng che PII. Về engine guardrail đầy đủ — mọi loại quy tắc, trường, và route — xem tài liệu tham khảo Guardrails.

1. Trường hợp dùng redact PII LLM trong một quy tắc

Phần khó của hệ thống redact PII LLM thường là chính hệ thống đường ống. PII Shield loại bỏ nó. Preset là một quy tắc pii duy nhất:
  • Type: PII detection (pii)
  • Action: Mask — thay mỗi match bằng một thẻ có kiểu
  • Entities: email, phone, ssn, credit_card, ip
Áp dụng nó một lần trong console, gắn nó vào một key, và mọi cuộc gọi trên key đó được sàng lọc mà không đổi SDK và không triển khai lại. Chính sách nằm ở gateway, không phải ứng dụng của bạn — ứng dụng vẫn gọi /v1/chat/completions y như trước.
Masking giai đoạn input là đường trực tiếp. PII Shield che request trước khi nó rời gateway, nên mô hình thượng nguồn không bao giờ thấy giá trị gốc. Masking trực tiếp output mô hình và phản hồi streamed nằm trong lộ trình; hãy hình dung PII Shield như chà sạch những gì bạn gửi, không phải những gì trả về. Để gate phản hồi mô hình hôm nay, một quy tắc block output được thực thi cả hai hướng — xem quy tắc giai đoạn outputphạm vi streaming.

2. Áp dụng preset trong console

Mọi bước ở đây là một hành động console trên gateway được lưu trữ dưới phiên của riêng bạn. Tạo và chỉnh sửa guardrails yêu cầu Developer+ trong workspace. Chỉ cuộc gọi /v1/* cuối cùng dùng một relay key sk-orca-....
1

Mở template

Trong console, mở Guardrails, nhấn split-button New guardrail, và chọn PII Shield từ danh mục template PII. Nó gieo một quy tắc masking pii duy nhất.
2

Đặt tên và lưu

Đặt cho nó một tên (≤ 64 ký tự), ví dụ pii-shield, và lưu. Một preset là một hạt giống, không phải một khóa — chỉnh sửa danh sách entity hoặc hành động tự do sau đó.
3

Test nó

Mở tab Test, dán một mẫu ở giai đoạn input, và chạy chính sách cục bộ — không có cuộc gọi thượng nguồn, không quota (xem §4).
4

Gắn một key

Chỉnh sửa một API key và chọn pii-shield từ dropdown Guardrail (đặt guardrail_id trên key), hoặc đánh dấu nó là mặc định workspace. Xem Gắn vào một keyMặc định tài khoản.

3. Cái gì được che, và thành cái gì

Trên một hành động mask, mỗi match được thay bằng một thẻ có kiểu — một email trở thành [EMAIL], một SSN trở thành [SSN]. Bộ detector built-in là đóng và được chia sẻ bởi engine, sandbox, và trình tạo quy tắc:
email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.
jp_mynumber (Japan My Number → [JP_MYNUMBER]), kr_rrn (Korea RRN → [KR_RRN]), và cn_resident_id (China resident ID → [CN_RESIDENT_ID]). Bật những cái khớp với khu vực pháp lý của bạn.
Xếp lớp một regex detector trên các built-in — một employee_id, một số tài khoản nội bộ — với một checksum luhn tùy chọn và một thay thế tùy chỉnh. Tối đa 25 mỗi quy tắc. Xem Entity PII tùy chỉnhĐịnh dạng masking.
Một quy tắc PII có thể áp dụng các hành động khác nhau cho các entity khác nhau qua entity_actions — che email / phone / ip, nhưng block trên credit_card hoặc ssn. Không cần các quy tắc chồng lấp. Xem Hành động.

4. Test trước khi bạn gắn

Chứng minh quy tắc làm điều bạn kỳ vọng trước khi bất kỳ key nào trỏ vào nó. Mở tab Test bên trong editor, dán một mẫu, chọn giai đoạn input, và chạy:
Reply to jane@acme.com please
Sandbox đánh giá chính sách hiện tại cục bộ và trả về verdict cộng văn bản đã render — không có gì được gửi lên thượng nguồn, không có gì được đo:
Reply to [EMAIL] please
Để có một lưới A/B đối với một corpus, Eval harness nằm cách một tab.

5. Gửi một request

Dùng một key ràng buộc với pii-shield, gọi OrcaRouter y như trước — không có header mới, không đổi SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
Gateway che email thành [EMAIL] trước khi chuyển tiếp — mô hình thượng nguồn nhận Reply to [EMAIL] please và không bao giờ thấy địa chỉ.
Đổi hành động của một entity thành block (qua ghi đè theo từng entity) và chính request kế tiếp mang entity đó bị từ chối với HTTP 400 guardrail_blocked. Một request bị block không tốn quota (một block input kích hoạt trước khi đo lường) và được đánh dấu skip-retry. Xem lỗi guardrail_blocked.

6. Xem cái gì đã kích hoạt

Mỗi quy tắc kích hoạt ghi lại một match — loại quy tắc, hành động, giai đoạn, và một chuỗi chi tiết — hiện ra trong feed Matches của workspace. Bản thân chuỗi con đã match (địa chỉ email thực tế) được ghi lại chỉ khi Log raw content được bật, mà mặc định tắt — lập trường bảo thủ về quyền riêng tư giữ PII đã redact khỏi cả telemetry của riêng bạn.
Đối với một kiểm soát redact, để Log raw content tắt thường là chính điểm: bạn được thấy rằng một email đã bị che và bao lâu một lần, mà không bắt lại giá trị bạn vừa chà sạch. Bật nó cho từng guardrail chỉ khi bạn cần chuỗi con để phân loại; cài đặt không hồi tố. Xem Matches feedLogging & quyền riêng tư.

7. Đi đâu tiếp theo

Entity PII tùy chỉnh

Thêm các regex detector của riêng bạn với kiểm tra Luhn tùy chọn, tối đa 25 mỗi quy tắc.

Định dạng masking

Kiểm soát thẻ có kiểu mà mỗi entity render thành.

Block secret

Bắt API key và thông tin xác thực với preset Secrets Blocker.

Tinh chỉnh dương tính giả

Đánh dấu dương tính giả và siết chặt detector từ Matches feed.
PII Shield che nội dung. Để quản trị lời gọi tool của một agent — từ chối các hành động hủy hoại, redact đối số lời gọi tool, yêu cầu phê duyệt — dùng Firewall. Bắt đầu với Bảo mật AI agentmối đe dọa data-exfiltration, hoặc đọc tài liệu tham khảo Guardrails cho engine hoàn chỉnh.