範本庫與預設 - OrcaRouter

你想快速就位一個內容政策，而不必手寫正規表示式或 PII 實體清單。範本庫就是捷徑：一組現成的防護欄預設，按使用情境分組，每一個都一鍵植入一個可運作的政策。挑一個、命名它，你就有了一個可綁定到金鑰的完整有序規則集——或先編輯。這是預設使用情境的一個聚焦落地頁。完整的防護欄引擎——每種規則類型、欄位、動作與路由——請見防護欄參考。

1. AI 防護欄範本庫給你什麼

一個預設是一個命名起點，它會把一個完整的 Policy（一條或多條有序規則）放進建立彈窗。預設在伺服器端撰寫，所以主控台選擇器、Test 沙盒與本文件全都描述完全相同的行為——只有一個真相來源。每個預設是種子，不是鎖。一旦你套用一個，你就擁有那份副本：重新命名它、新增或刪除規則、變更一條規則的動作或階段、重新調校一個偵測器。原始範本不會約束你的編輯。

套用一個預設，與所有防護欄撰寫一樣，是你自己工作區工作階段下的一個主控台動作，而建立或編輯防護欄需要工作區中的 Developer+。只有最後的 /v1/* 中繼呼叫使用一把 sk-orca-... 金鑰。

2. 預設類別

選擇器把預設分組為八個類別。每一個都對應到一個你原本得手動建造的常見控制：

PII——遮罩或封鎖個人資料

偵測並遮罩（或封鎖）電子郵件、電話、SSN、卡號、IP 等等。從 PII Shield 開始進行單規則遮罩，或在 PII 絕不能抵達供應商時用一個嚴格封鎖器。

Secrets——讓憑證不進入提示

在 AWS ／ OpenAI ／ GitHub 金鑰、PEM 私鑰、雲端權杖與加密錢包地址離開閘道之前封鎖它們。參見封鎖密鑰。

Compliance——受監管資料防護欄

PCI 卡號封鎖、EU／UK 識別碼封鎖、醫療識別碼封鎖，以及一個在不改變流量的情況下記錄 PII 出現的僅觀察合規記錄器。

Brand——封鎖清單與品牌安全

針對髒話、競爭對手提及與區域特定禁用詞的關鍵字封鎖清單——封鎖或遮罩。參見品牌安全和敏感詞。

Safety——注入、越獄、自我傷害

針對提示注入措辭、越獄／角色扮演模式、系統提示詞洩漏偵測與自我傷害封鎖清單的關鍵字／正規表示式防護欄。參見提示注入。

Cost——大小與長度上限

對請求提示與模型回應的 max_chars 上限，以限制成本與延遲。參見成本防護欄。

Agent——代理式內容過濾器

針對代理流程的 URL 過濾器、markdown 圖片封鎖（圖片外洩防禦）、shell 注入模式，以及輸出中的 SQL 注入過濾器。參見代理式防護欄。

Code security——密鑰、授權、風險 API

.env ／密鑰檔案賦值封鎖、對請求與模型輸出的強 copyleft 授權標記（GPL / AGPL / LGPL / SSPL），以及一個非封鎖的、會註記引用高風險匯點（eval、os.system、pickle.loads）的提示的公告。參見程式碼安全。

預設只植入確定性規則類型——關鍵字、正規表示式、PII 與 max-chars。進階規則類型（外部廠商、LLM 評審、情境接地）從規則建構器新增，而非從範本，因為它們需要一個你選擇的連接或模型。

3. 把一個預設作為種子套用

這裡的每個步驟都是一個主控台動作。中繼金鑰只在最後的請求中出現。

開啟範本選擇器

在主控台中開啟 Guardrails 並按一下 New guardrail 分割按鈕。選擇器會按上方的八個類別分組開啟。

挑選一個預設

選擇一個——例如 PII 類別中的 PII Shield。它會植入一個完整的政策（這裡是一條遮罩 pii 規則）。選擇器會顯示每個預設的描述，這樣你在套用它之前就知道它做什麼。

命名它並自由編輯

給它一個名稱（≤ 64 字元）。被植入的規則現在是你的——新增、刪除或重新調校它們任何一條。預設是種子，不是鎖。

綁定前先測試

開啟 Test 分頁，貼上一個樣本，選擇一個階段，並在本機執行政策——沒有上游呼叫，不消耗配額。在任何金鑰指向它之前證明它如你所期望地運作。

綁定一把金鑰

編輯一個 API 金鑰並從 Guardrail 下拉選單選擇該防護欄（在金鑰上設定 guardrail_id），或將它標記為工作區預設值。參見綁定到金鑰和帳戶預設值。

4. 一個具體範例：植入，然後強制執行

套用 PII Shield 預設。它正好植入一條規則：

{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}

那是一個開箱即用的可用遮罩政策。但因為預設是一顆種子，你可以立即收緊它——例如，用一個每實體覆寫把兩個實體換成 block，這樣卡號與 SSN 就被直接拒絕，而其餘被遮罩：

{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}

儲存、綁定到一把金鑰，並像以前一樣呼叫閘道——無需修改 SDK，無需重新部署：

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

閘道會在轉送前把電子郵件遮罩為 [EMAIL]。一個攜帶卡號的請求會以 HTTP 400 guardrail_blocked 被拒絕——它不消耗配額（輸入封鎖在計量之前觸發）並被標記為 skip-retry。參見 guardrail_blocked 錯誤。

PII Shield 預設植入一條 both 階段的遮罩規則，但模型輸出與串流回應的即時遮罩仍在規劃中——輸入階段遮罩是已上線的路徑（閘道在模型看到之前清洗請求）。若要在今天把關模型的回應，一條輸出 block 規則在串流與非串流上都會強制執行。參見輸出階段規則和串流覆蓋。

5. 套用之後——其餘就是引擎

一個預設只是一個撰寫規則的快速方式。下游的一切都是正常的防護欄引擎：

你得到	在哪裡
每規則動作	動作
測試 + 評測	測試與評測
什麼觸發了	匹配動態
回滾一次變更	版本控制

對一個防護欄的每次建立、更新與刪除——包括你套用一個預設並儲存的那一刻——都會寫入一筆版本化的歷史列。你可以比對任意兩個版本並還原到一個較早的，所以編輯一個被植入的政策永遠不是一道單向門。參見版本控制。

6. 下一步去哪裡

PII Shield

一鍵式 PII 遮罩預設，從頭到尾。

封鎖密鑰

Secrets Blocker 預設——捕捉請求中的金鑰與憑證。

代理式防護欄

針對代理流程的 URL、markdown 圖片、shell 與 SQL 過濾器。

防護欄參考

完整引擎——每種規則類型、欄位與路由。

預設植入內容政策。若要治理一個代理的工具呼叫——拒絕破壞性動作、遮罩工具呼叫引數、要求審批——從防火牆和保護 AI 代理開始。關於這兩層如何分工，參見防護欄與防火牆。

​1. AI 防護欄範本庫給你什麼

​2. 預設類別

​3. 把一個預設作為種子套用

​4. 一個具體範例：植入，然後強制執行

​5. 套用之後——其餘就是引擎

​6. 下一步去哪裡

PII Shield

封鎖密鑰

代理式防護欄

防護欄參考

1. AI 防護欄範本庫給你什麼

2. 預設類別

3. 把一個預設作為種子套用

4. 一個具體範例：植入，然後強制執行

5. 套用之後——其餘就是引擎

6. 下一步去哪裡