jane@acme.com → [EMAIL]),所以模型仍能讀到一個連貫的提示,而原始值永遠不會離開你的工作區。
本頁聚焦於遮罩渲染什麼、如何改變標籤,以及如何在單一規則上遮罩某些實體並封鎖其他實體。完整引擎——每種規則類型、階段與路由——請見 防護欄參考,而專門針對請求的遮罩請見 輸入階段規則。
1. 用具型別標籤遮罩 LLM 提示攜帶的敏感資料
一條帶有 mask 動作的pii 規則會偵測一個實體,並把每個匹配項替換為一個具型別隱碼標籤——一個方括號中的大寫標籤,指名什麼被移除而不洩露值:
| 實體 | 渲染後的標籤 |
|---|---|
email | [EMAIL] |
credit_card | [CREDIT_CARD] |
ssn | [SSN] |
email、phone、credit_card、ssn、ip、iban、mac_address、jwt、aws_access_key、api_key_openai、bitcoin_address,外加區域性的 jp_mynumber、kr_rrn 和 cn_resident_id——各自渲染它自己的方括號標籤([PHONE]、[IBAN]、[JP_MYNUMBER] 等等)。標籤是確定性的:同一個實體永遠渲染相同的標籤,所以下游提示保持穩定,你的日誌讀起來乾淨。
就模型品質而言,具型別標籤勝過一概而論的
[REDACTED]。模型仍然知道它看的是一個電子郵件對帳號對電話號碼,所以它能繼續推理資料的形狀——「回覆 [EMAIL]」仍是一條可執行的指令——而永遠不持有真實值。2. 一個具體範例
在主控台中你自己的工作階段下撰寫規則——防護欄設定需要 Developer+,而不是中繼金鑰。在一個名為pii-shield 的防護欄中新增一條 pii 規則:
guardrail_id,或將它標記為工作區預設值——參見 綁定到金鑰),然後用那把 sk-orca-... 中繼金鑰呼叫閘道:
[EMAIL] about her SSN [SSN]”。上游模型永遠看不到地址或號碼。先在編輯器的 Test 分頁中證明確切的渲染(無上游呼叫,不消耗配額)——參見 測試與評測。
3. 用 mask_with 覆寫標籤
內建實體渲染一個固定標籤。自訂實體——你自己疊加於內建集合之上的正規表示式偵測器——讓你用 mask_with 自己設定替換文字:
mask_with 做什麼
mask_with 做什麼
mask_with 是那個實體匹配項的逐字替換字串。EMP-004217 變成 [STAFF_ID]。讓它留空,匹配項就會渲染預設標籤 [<UPPERCASE_NAME>]——這裡是 [EMPLOYEE_ID]——所以一個自訂偵測器即使沒有覆寫也永遠產生一個可讀的、具型別的隱碼。自訂實體欄位
自訂實體欄位
name(小寫 ASCII /數字/底線,必須以字母開頭)、pattern(一個 Go RE2 正規表示式——線性時間、無回溯參照)、可選的 checksum(luhn 驗證卡號形狀的數字),以及可選的 mask_with。每條規則最多 25 個自訂實體——每個都是對全文的一次掃描,所以這個上限讓熱路徑保持線性。參見 自訂 PII 實體。4. 遮罩某些實體、封鎖其他實體——entity_actions
單一 pii 規則可透過 entity_actions 對不同實體套用不同動作,而不必堆疊三條重疊的規則。經典形狀:遮罩低敏感度的聯絡資料,但直接封鎖高敏感度欄位。
email、phone 和 ip 遵循規則頂層的 mask 並渲染 [EMAIL] / [PHONE] / [IP];而一個 credit_card 或 ssn 匹配則改為以 HTTP 400 guardrail_blocked 封鎖整個請求。
| 欄位 | 規則 |
|---|---|
| 鍵 | 必須是規則上已宣告的一個實體(內建或自訂)。 |
| 值 | block、mask、flag 或 annotate。 |
一個被封鎖的請求不消耗配額——輸入階段封鎖在計量之前觸發。一個被遮罩的請求會以淨化後的文字通過。所以一條規則可以安靜地遮罩例行欄位並硬性停止受監管的欄位,只需一次綁定且無需修改應用程式。
5. Mask 對 block 對 flag
遮罩是一條規則(或每實體覆寫)可以採取的動作之一。依你想擾動流量的程度來選擇:mask
把匹配項遮罩為一個具型別標籤,並以淨化後的文字讓請求通過。模型永遠看不到原始值。
block
以 HTTP 400
guardrail_blocked 拒絕整個請求。沒有東西抵達模型。用於絕不能傳輸的資料。flag
不改變流量的任何部分——只記錄一個匹配。在強制執行前衡量一條規則會多常觸發。
6. 驗證什麼被遮罩了
每條觸發的規則都會在工作區 匹配動態 中記錄一個 match——規則類型、動作、階段,以及一個詳情字串。匹配到的子字串本身(原始電子郵件、實際卡號)只在 Log raw content 開啟時才會記錄,而它預設為關閉——隱私保守姿態,因為整個重點就是讓原始值不進入你的日誌。7. 下一步去哪裡
- PII Shield 預設——你可以一鍵套用的單規則、遮罩一切的起點。
- 自訂 PII 實體——用
mask_with和可選的luhn撰寫你自己的正規表示式偵測器。 - 輸入階段規則——遮罩今天即時執行的地方,在模型之前、計量之前。
- 封鎖密鑰——對於憑證,封鎖(而非遮罩)才是正確的選擇。
- 串流覆蓋——今天哪些階段/串流組合是遮罩對封鎖。
