跳轉到主要內容
你想讓個人資料不進入上游模型。一個客戶貼上一個電子郵件地址、一份客服逐字稿攜帶一個卡號、一個代理提示洩漏一個 SSN——而這些都不該以明文抵達 OpenAI、Anthropic 或 Google。PII Shield 是修正這個問題最快的方式:一個單規則的防護欄預設,會偵測請求中的敏感實體並在閘道轉送呼叫之前把每一個遮罩為具型別標籤。 這是 PII 遮罩使用情境的一個聚焦落地頁。完整的防護欄引擎——每種規則類型、欄位與路由——請見 防護欄參考

1. 一條規則搞定 LLM PII 遮罩使用情境

LLM PII 遮罩 配管的難處通常就在配管本身。PII Shield 移除了它。這個預設是一條單一 pii 規則
  • 類型: PII detection (pii)
  • 動作: Mask——把每個匹配項替換為一個具型別標籤
  • 實體: emailphonessncredit_cardip
在主控台中套用它一次,綁定到一把金鑰,那把金鑰上的每次呼叫都會被審查,無需修改 SDK,無需重新部署。政策存在於閘道中,而不是你的應用程式中——你的應用程式像以前一樣繼續呼叫 /v1/chat/completions
輸入階段遮罩是已上線的路徑。 PII Shield 會在請求離開閘道之前遮罩它,所以上游模型永遠看不到原始值。模型輸出與串流回應的即時遮罩仍在規劃中;把 PII Shield 視為清洗你發送出去的內容,而不是回來的內容。若要在今天把關模型的回應,一條輸出 block 規則在兩種情況下都會強制執行——參見 輸出階段規則串流覆蓋

2. 在主控台中套用預設

這裡的每個步驟都是託管閘道上你自己工作階段下的一個主控台動作。建立與編輯防護欄需要工作區中的 Developer+。只有最後的 /v1/* 呼叫使用 sk-orca-... 中繼金鑰。
1

開啟範本

在主控台中開啟 Guardrails,按一下 New guardrail 分割按鈕,並從 PII 範本類別選擇 PII Shield。它會植入一條遮罩 pii 規則。
2

命名並儲存

給它一個名稱(≤ 64 字元),例如 pii-shield,並儲存。預設是種子,不是鎖——之後可自由編輯實體清單或動作。
3

測試它

開啟 Test 分頁,在 input 階段貼上一個樣本,並在本機執行政策——沒有上游呼叫,不消耗配額(參見 §4)。
4

綁定一把金鑰

編輯一個 API 金鑰並從 Guardrail 下拉選單選擇 pii-shield(在金鑰上設定 guardrail_id),或將它標記為工作區預設值。參見 綁定到金鑰帳戶預設值

3. 什麼會被遮罩,以及遮罩成什麼

mask 動作下,每個匹配項會被替換為一個具型別標籤——電子郵件變成 [EMAIL],SSN 變成 [SSN]。內建的偵測器集合是封閉的,由引擎、沙盒與規則建構器共用:
emailphonecredit_cardssnipibanmac_addressjwtaws_access_keyapi_key_openaibitcoin_address
jp_mynumber(日本 My Number → [JP_MYNUMBER])、kr_rrn(韓國 RRN → [KR_RRN]),以及 cn_resident_id(中國居民身分證 → [CN_RESIDENT_ID])。啟用符合你司法管轄區的那些。
在內建之上疊加一個正規表示式偵測器——一個 employee_id、一個內部帳號——帶有一個可選的 luhn 校驗與一個自訂替換。每條規則最多 25 個。參見 自訂 PII 實體遮罩格式
一條 PII 規則可透過 entity_actions不同實體套用不同動作——遮罩 email / phone / ip,但對 credit_cardssn 封鎖。不需要重疊的規則。參見 動作

4. 綁定前先測試

在任何金鑰指向它之前,先證明規則如你所期望地運作。開啟編輯器內的 Test 分頁,貼上一個樣本,選擇 input 階段,然後執行:
Reply to jane@acme.com please
沙盒會在本機評估目前的政策,並傳回裁決加上渲染後的文字——不會向上游傳送任何東西,也不會計量任何東西:
Reply to [EMAIL] please
若要針對一個語料庫進行 A/B 網格測試,評測工具 就在隔壁分頁。

5. 發送請求

用一把綁定到 pii-shield 的金鑰,像以前一樣呼叫 OrcaRouter——無新標頭,無需修改 SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
閘道會在轉送前把電子郵件遮罩為 [EMAIL]——上游模型收到的是 Reply to [EMAIL] please 而永遠看不到地址。
把一個實體的動作換成 block(透過每實體覆寫),下一個攜帶該實體的請求就會以 HTTP 400 guardrail_blocked 被拒絕。被封鎖的請求不消耗配額(輸入封鎖在計量之前觸發)並被標記為 skip-retry。參見 guardrail_blocked 錯誤

6. 查看觸發了什麼

每條觸發的規則都會記錄一個 match——規則類型、動作、階段,以及一個詳情字串——呈現在工作區 Matches 動態中。匹配到的子字串本身(實際的電子郵件地址)Log raw content 開啟時才會記錄,而它預設為關閉——隱私保守姿態,讓被遮罩的 PII 也不進入你自己的遙測。
對一個遮罩控制而言,讓 Log raw content 保持關閉通常就是重點:你能看到某個 email 被遮罩了以及多常被遮罩,而不必重新擷取你剛剛清洗掉的那個值。只在你需要子字串進行分流時才逐個防護欄開啟它;該設定不可追溯生效。參見 匹配動態日誌與隱私

7. 下一步去哪裡

自訂 PII 實體

新增你自己的正規表示式偵測器,帶有可選的 Luhn 校驗,每條規則最多 25 個。

遮罩格式

控制每個實體渲染成的具型別標籤。

封鎖密鑰

用 Secrets Blocker 預設捕捉 API 金鑰與憑證。

調校誤報

從 Matches 動態標記誤報並收緊偵測器。
PII Shield 遮罩內容。若要治理一個代理的工具呼叫——拒絕破壞性動作、遮罩工具呼叫引數、要求審批——請使用 防火牆。從 保護 AI 代理資料外洩威脅 開始,或閱讀 防護欄參考 以了解完整引擎。