AKIA... 金鑰的提示、一份貼上的 .env、一個回顯自己 sk-... 權杖的代理——其中任何一個都可能把一個有效憑證以明文送到 OpenAI、Anthropic 或 Google,並落入他們與你的日誌中。Secrets Blocker 在閘道處阻止這件事:一個一鍵式的防護欄預設,會掃描請求中的憑證形狀,並在單一位元組離開你的閘道之前以 HTTP 400 拒絕呼叫。
這是密鑰洩漏使用情境的一個聚焦落地頁。完整的防護欄引擎——每種規則類型、欄位與路由——請見 防護欄參考。
1. 一個預設預防 LLM API 金鑰洩漏流程
預防 LLM API 金鑰洩漏 配管的整個重點是在上游呼叫之前捕捉憑證,而不是在它已經進入某個供應商的請求日誌之後。Secrets Blocker 預設正是做這件事。它是一個由輸入階段 block 規則組成的小型防護欄,每一條都是針對一個知名憑證形狀的正規表示式:
AWS 存取金鑰
AWS 存取金鑰
AKIA 後接 16 個大寫字母數字字元——典型的 AWS access-key-id 形狀。OpenAI 風格密鑰
OpenAI 風格密鑰
一個
sk- 前綴後接一個長權杖主體——OpenAI 與數個相似供應商金鑰所使用的形狀。GitHub 個人存取權杖
GitHub 個人存取權杖
一個
ghp_ 前綴後接一個 36 字元的主體。/v1/chat/completions,無需修改 SDK,無需重新部署。
輸入階段,計量之前。 Secrets Blocker 審查你發送的內容。一個匹配會在模型被呼叫之前拒絕呼叫,所以憑證永不抵達供應商,而被封鎖的請求不消耗配額。若要也捕捉一個模型發出回客戶端的密鑰,把它與一個輸出封鎖預設配對——參見 §5。
2. 在主控台中套用預設
這裡的每個步驟都是託管閘道上你自己工作階段下的一個主控台動作。建立與編輯防護欄需要工作區中的 Developer+。只有最後的/v1/* 呼叫使用 sk-orca-... 中繼金鑰。
開啟範本
在主控台中開啟 Guardrails,按一下 New guardrail 分割按鈕,並從 Secrets 範本類別選擇 Secrets & API-Key Blocker。它會植入輸入階段封鎖規則。
命名並儲存
給它一個名稱(≤ 64 字元),例如
secrets-blocker,並儲存。預設是種子,不是鎖——之後可自由新增或編輯規則(參見 §4)。測試它
開啟 Test 分頁,在
input 階段貼上一個樣本憑證,並在本機執行政策——沒有上游呼叫,不消耗配額(參見 §3)。3. 綁定前先測試
在任何金鑰指向它之前,先證明規則會觸發。開啟編輯器內的 Test 分頁,貼上一個假憑證,選擇input 階段,然後執行:
4. 擴展覆蓋範圍
Secrets Blocker 涵蓋了三種流量最高的形狀。Secrets 類別出貨時帶有你可以與它並排套用的同類預設,而你也可以為你的技術堆疊簽發的任何權杖撰寫你自己的regex 規則:
Private Keys & Cloud Tokens
一個配套的 Secrets 預設,會在請求上封鎖 PEM 私鑰、Slack 與 Stripe 權杖、Google API 金鑰,以及 JWT。
Crypto Wallet Block
當 BTC 與 ETH 風格錢包地址絕不該抵達供應商時,在請求上封鎖它們。
input 階段以動作 block 新增一條 regex 規則——RE2 模式、線性時間、無回溯參照。壞模式在儲存時就會被拒絕,所以一個你能儲存的防護欄總是可編譯。
5. 也捕捉回應中的密鑰
Secrets Blocker 審查請求。一個獨立的 Secrets 預設 Code Secret in Output 會審查模型的回應中是否有私鑰與 AWS/OpenAI 風格的權杖,並在有一個洩漏回來時封鎖呼叫。 輸出 block 在兩種情況下都會強制執行:在非串流回應上,答案會在回傳前被審查;在串流回應上,一個掃描器會在任何被封鎖的內容抵達客戶端之前切斷串流。一個輸出階段的封鎖會退還已預先扣除的配額。參見 輸出階段規則 和 串流覆蓋。6. 一個封鎖長什麼樣
一個被封鎖的請求會傳回 HTTP 400,錯誤代碼為guardrail_blocked,並附上指名觸發的防護欄與規則的訊息:
guardrail_blocked 錯誤。
7. 查看觸發了什麼
每條觸發的規則都會記錄一個 match——規則類型、動作、階段,以及一個詳情字串——呈現在工作區 Matches 動態中。匹配到的子字串本身(憑證)只在 Log raw content 開啟時才會記錄,而它預設為關閉。8. 下一步去哪裡
正規表示式偵測器
用 RE2 正規表示式規則撰寫你自己的憑證模式。
動作
為每條規則選擇 block、mask、flag、annotate 或 spotlight——並為每個實體選擇 block、mask、flag 或 annotate。
PII Shield
在模型看到之前把電子郵件、SSN 與卡號遮罩為具型別標籤。
調校誤報
從 Matches 動態標記誤報並收緊偵測器。
