跳轉到主要內容
你想快速就位一個內容政策,而不必手寫正規表示式或 PII 實體清單。範本庫就是捷徑:一組現成的防護欄預設,按使用情境分組,每一個都一鍵植入一個可運作的政策。挑一個、命名它,你就有了一個可綁定到金鑰的完整有序規則集——或先編輯。 這是預設使用情境的一個聚焦落地頁。完整的防護欄引擎——每種規則類型、欄位、動作與路由——請見 防護欄參考

1. AI 防護欄範本庫給你什麼

一個預設是一個命名起點,它會把一個完整的 Policy(一條或多條有序規則)放進建立彈窗。預設在伺服器端撰寫,所以主控台選擇器、Test 沙盒 與本文件全都描述完全相同的行為——只有一個真相來源。 每個預設是種子,不是鎖。一旦你套用一個,你就擁有那份副本:重新命名它、新增或刪除規則、變更一條規則的 動作階段、重新調校一個偵測器。原始範本不會約束你的編輯。
套用一個預設,與所有防護欄撰寫一樣,是你自己工作區工作階段下的一個主控台動作,而建立或編輯防護欄需要工作區中的 Developer+。只有最後的 /v1/* 中繼呼叫使用一把 sk-orca-... 金鑰。

2. 預設類別

選擇器把預設分組為八個類別。每一個都對應到一個你原本得手動建造的常見控制:
偵測並遮罩(或封鎖)電子郵件、電話、SSN、卡號、IP 等等。從 PII Shield 開始進行單規則遮罩,或在 PII 絕不能抵達供應商時用一個嚴格封鎖器。
在 AWS / OpenAI / GitHub 金鑰、PEM 私鑰、雲端權杖與加密錢包地址離開閘道之前封鎖它們。參見 封鎖密鑰
PCI 卡號封鎖、EU/UK 識別碼封鎖、醫療識別碼封鎖,以及一個在不改變流量的情況下記錄 PII 出現的僅觀察 合規記錄器
針對髒話、競爭對手提及與區域特定禁用詞的關鍵字封鎖清單——封鎖或遮罩。參見 品牌安全敏感詞
針對提示注入措辭、越獄/角色扮演模式、系統提示詞洩漏偵測與自我傷害封鎖清單的關鍵字/正規表示式防護欄。參見 提示注入
對請求提示與模型回應的 max_chars 上限,以限制成本與延遲。參見 成本防護欄
針對代理流程的 URL 過濾器、markdown 圖片封鎖(圖片外洩防禦)、shell 注入模式,以及輸出中的 SQL 注入過濾器。參見 代理式防護欄
.env /密鑰檔案賦值封鎖、對請求與模型輸出的強 copyleft 授權標記(GPL / AGPL / LGPL / SSPL),以及一個非封鎖的、會註記引用高風險匯點(evalos.systempickle.loads)的提示的公告。參見 程式碼安全
預設只植入確定性規則類型——關鍵字、正規表示式、PII 與 max-chars。進階規則類型(外部廠商、LLM 評審、情境接地)從規則建構器新增,而非從範本,因為它們需要一個你選擇的連接或模型。

3. 把一個預設作為種子套用

這裡的每個步驟都是一個主控台動作。中繼金鑰只在最後的請求中出現。
1

開啟範本選擇器

在主控台中開啟 Guardrails 並按一下 New guardrail 分割按鈕。選擇器會按上方的八個類別分組開啟。
2

挑選一個預設

選擇一個——例如 PII 類別中的 PII Shield。它會植入一個完整的政策(這裡是一條遮罩 pii 規則)。選擇器會顯示每個預設的描述,這樣你在套用它之前就知道它做什麼。
3

命名它並自由編輯

給它一個名稱(≤ 64 字元)。被植入的規則現在是你的——新增、刪除或重新調校它們任何一條。預設是種子,不是鎖。
4

綁定前先測試

開啟 Test 分頁,貼上一個樣本,選擇一個階段,並在本機執行政策——沒有上游呼叫,不消耗配額。在任何金鑰指向它之前證明它如你所期望地運作。
5

綁定一把金鑰

編輯一個 API 金鑰並從 Guardrail 下拉選單選擇該防護欄(在金鑰上設定 guardrail_id),或將它標記為工作區預設值。參見 綁定到金鑰帳戶預設值

4. 一個具體範例:植入,然後強制執行

套用 PII Shield 預設。它正好植入一條規則:
{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}
那是一個開箱即用的可用遮罩政策。但因為預設是一顆種子,你可以立即收緊它——例如,用一個每實體覆寫把兩個實體換成 block,這樣卡號與 SSN 就被直接拒絕,而其餘被遮罩:
{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}
儲存、綁定到一把金鑰,並像以前一樣呼叫閘道——無需修改 SDK,無需重新部署:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
閘道會在轉送前把電子郵件遮罩為 [EMAIL]。一個攜帶卡號的請求會以 HTTP 400 guardrail_blocked 被拒絕——它不消耗配額(輸入封鎖在計量之前觸發)並被標記為 skip-retry。參見 guardrail_blocked 錯誤
PII Shield 預設植入一條 both 階段的遮罩規則,但模型輸出與串流回應的即時遮罩仍在規劃中——輸入階段遮罩是已上線的路徑(閘道在模型看到之前清洗請求)。若要在今天把關模型的回應,一條輸出 block 規則在串流與非串流上都會強制執行。參見 輸出階段規則串流覆蓋

5. 套用之後——其餘就是引擎

一個預設只是一個撰寫規則的快速方式。下游的一切都是正常的防護欄引擎:
你得到在哪裡
每規則動作動作
測試 + 評測測試與評測
什麼觸發了匹配動態
回滾一次變更版本控制
對一個防護欄的每次建立、更新與刪除——包括你套用一個預設並儲存的那一刻——都會寫入一筆版本化的歷史列。你可以比對任意兩個版本並還原到一個較早的,所以編輯一個被植入的政策永遠不是一道單向門。參見 版本控制

6. 下一步去哪裡

PII Shield

一鍵式 PII 遮罩預設,從頭到尾。

封鎖密鑰

Secrets Blocker 預設——捕捉請求中的金鑰與憑證。

代理式防護欄

針對代理流程的 URL、markdown 圖片、shell 與 SQL 過濾器。

防護欄參考

完整引擎——每種規則類型、欄位與路由。
預設植入內容政策。若要治理一個代理的工具呼叫——拒絕破壞性動作、遮罩工具呼叫引數、要求審批——從 防火牆保護 AI 代理 開始。關於這兩層如何分工,參見 防護欄與防火牆