1. 一個預設搞定僅觀察防護欄
Compliance Logger (observe-only) 住在防護欄範本選擇器的 Compliance 類別中。它是一條動作為 flag 的單一pii 規則——記錄一個匹配並讓流量保持原樣的動作。沒有封鎖、沒有遮罩、沒有模型呼叫,也無需修改 SDK:政策存在於閘道中,而你的應用程式像以前一樣繼續呼叫 /v1/chat/completions。
標記,絕不強制執行
動作是 flag——它註記一個匹配並讓請求與回應原封不動地通過。沒有東西被封鎖,沒有東西被遮罩。
兩個階段
階段 both——規則掃描請求與模型的回應,所以你能看到進來與出去途中的 PII。
零配額開銷
內建 PII 偵測是確定性的字串比對——無上游評審呼叫、無額外權杖、沒有東西串列地排在模型後面。
Flag = 僅觀察。 一個
flag 動作記錄一個匹配且不改變流量。它是在強制執行一個政策之前衡量它,或在不更改行為的情況下保留一份合規日誌的正確工具。完整的 block / mask / flag 取捨請見 動作。2. 合規記錄器預設,與出貨時完全一致
在主控台 Guardrails 檢視中開啟 New guardrail 分割按鈕並選擇 Compliance 範本類別。Compliance Logger (observe-only) 種子是一條單一的pii 規則:
| 欄位 | 值 |
|---|---|
| 類型 | pii |
| 階段 | both(請求 + 回應) |
| 動作 | flag(僅觀察) |
| 實體 | email、phone、ssn、credit_card、ip |
3. 在主控台中套用預設
這裡的每個步驟都是你自己工作階段下的一個主控台動作。建立與編輯防護欄需要工作區中的 Developer+。只有最後的/v1/* 呼叫使用 sk-orca-... 中繼金鑰。
開啟範本
在主控台中開啟 Guardrails,按一下 New guardrail 分割按鈕,並從 Compliance 範本類別選擇 Compliance Logger (observe-only)。
測試它
開啟 Test 分頁,在
input 階段貼上一個樣本,並在本機執行政策——沒有上游呼叫,不消耗配額(參見 §5)。4. 一個具體範例
一個名為compliance-logger 的防護欄(預設,未更改)被綁定到一把金鑰。像以前一樣呼叫閘道——無新標頭,無需修改 SDK:
pii 規則標記了 email 和 ssn,而每個匹配都落入工作區 Matches 動態。呼叫方永遠看不到差異;你得到稽核軌跡。
5. 綁定前先測試
在任何金鑰指向它之前,先證明規則標記你所期望的東西。開啟編輯器內的 Test 分頁,貼上一個樣本,選擇一個階段,然後執行:6. 查看觸發了什麼
這是一個僅觀察預設的整個重點:Matches 動態。 每個被標記的出現都會記錄一個匹配——規則類型、動作、階段,以及一個詳情字串——呈現在GET /api/guardrail/match(Member)。匹配到的子字串本身(實際的電子郵件、SSN)只在 Log raw content 開啟時才會記錄,而它預設為關閉。
按階段篩選動態以查看 PII 在哪裡進入你的流量——輸入提示對模型輸出——並按規則類型篩選以隔離
pii 規則。匹配到的實體(email、ssn、…)攜帶在每個匹配的詳情字串中。那個訊號就是告訴你是否準備好把動作從 flag 翻成 block 或 mask 的依據。
每次對防護欄的編輯都會在同一交易中寫入一筆版本化的歷史列——比對任意兩個版本並從 History 檢視還原。參見 版本控制。
7. 從僅觀察到強制執行
合規記錄器被設計為一次推出的第一階段:步驟 1——觀察
步驟 1——觀察
綁定僅標記的預設,並讓 Matches 動態以實際流量填滿。沒有任何請求曾被封鎖,所以在你衡量的同時對生產零風險。
步驟 2——調校
步驟 2——調校
使用動態並 調校誤報 以確認實體集合符合你的資料且不吵雜。
步驟 3——強制執行
步驟 3——強制執行
把動作翻成 mask(在模型之前遮罩 PII)或 block,或換成一個強制執行的預設。使用每實體的
entity_actions 在單一規則中遮罩某些實體並封鎖高嚴重性的那些。8. 下一步去哪裡
動作:block / mask / flag
完整的動作模型——何時觀察、何時遮罩、何時拒絕。
PII Shield
強制執行的對應物——在請求上遮罩 PII 而非只是記錄它。
匹配動態
瀏覽、分組、篩選並匯出每個被標記的出現。
日誌與隱私
Log-raw-content 切換與預設記錄什麼。
