這裡的每個步驟都是託管閘道(
api.orcarouter.ai)上的一個主控台動作。防護欄設定在你自己的工作階段下執行;只有最後的 /v1/* 呼叫使用 sk-orca-... 中繼金鑰。建立與編輯防護欄需要工作區中的 Developer+。1. 如何用五個步驟新增 LLM 防護欄
以下是整個流程的一覽——每個步驟在下方都有展開。2. 建立防護欄
在主控台中開啟 Guardrails 並按一下 New guardrail。防護欄是一份工作區層級的命名內容政策——一份閘道會針對請求輸入與模型輸出執行的有序規則清單。把它命名為pii-shield 並儲存。
3. 新增規則
每條規則決定三件事——尋找什麼(規則類型)、在哪裡尋找(階段),以及要做什麼(動作)。新增一條規則:- 類型: PII detection (
pii) - 階段: Input(請求)
- 動作: Mask——遮罩匹配項
- 實體:
email、phone、ssn
[EMAIL],SSN 變成 [SSN]。七種規則類型(keyword、regex、pii、max_chars、external、llm_judge、grounding)與五種動作(block、mask、flag、annotate、spotlight)在 參考 中有涵蓋。對這第一個防護欄而言,一條遮罩規則就夠了。
遮罩在兩個階段都已上線。輸入階段規則會在模型看到請求之前遮罩它;輸出階段規則會遮罩模型的回應——在非串流回應上,以及在串流回應上逐塊處理——然後客戶端才收到。Block 在兩個階段也都會強制執行。如果你想把關模型的回應,將規則的階段設為
output(或 both);參見 輸出階段規則。4. 在沙盒中測試
在把防護欄綁定到任何金鑰之前,先證明它如你所期望地運作。開啟編輯器內的 Test 分頁,貼上一個樣本,選擇input 階段,然後執行:
5. 綁定到金鑰
在金鑰指向防護欄之前,防護欄什麼都不做。有兩種綁定方式:逐金鑰
編輯一個 API 金鑰,並從 Guardrail 下拉選單選擇該防護欄。這會在金鑰上設定
guardrail_id。參見 綁定到金鑰。工作區預設值
將防護欄標記為工作區預設值,這樣任何沒有明確綁定的金鑰都會繼承它。參見 帳戶預設值。
| 順序 | 套用什麼 |
|---|---|
| 1 | 金鑰明確的 guardrail_id(如果它存在且已啟用)。 |
| 2 | 工作區預設值(如果金鑰沒有綁定)。 |
| 3 | 無——請求與沒有政策的工作區位元組完全一致。 |
6. 發送請求
用一個綁定到pii-shield 的金鑰,像以前一樣呼叫 OrcaRouter——無需修改 SDK,無需新標頭:
[EMAIL]——上游模型永遠看不到這個地址。把規則的動作換成 block,下一個包含該實體的請求就會以 HTTP 400 guardrail_blocked 被拒絕。被封鎖的請求不消耗配額(輸入封鎖在計量之前觸發;輸出封鎖會退還已預先扣除的配額)並被標記為 skip-retry。完整的回應形狀請見 guardrail_blocked 錯誤。
7. 下一步去哪裡
查看觸發了什麼
查看觸發了什麼
遮罩超越基礎範圍
遮罩超越基礎範圍
PII 偵測涵蓋
email、phone、credit_card、ssn、ip、iban、mac_address、jwt、aws_access_key、api_key_openai、bitcoin_address(外加區域性實體),而且你可以撰寫自己的。參見 PII Shield、自訂 PII 實體 和 遮罩格式。回滾一次變更
回滾一次變更
每次編輯都會寫入一筆版本歷史列。開啟 History 以比對與還原。參見 版本控制。
