缺乏歸因與鑑識

當一個代理出了差錯時，第一個問題總是一樣的：*它到底做了什麼，以及誰改了那個讓它得逞的政策？*沒有軌跡你兩者都答不出來。你無法向稽核員證明某個控制在當天有效、你無法把一次真實攻擊與一個吵雜的誤報區分開來，而你也無法重建那次外洩了該列的執行。 OrcaRouter 邊走邊記錄答案。每一個被審查的提示詞、每一次工具呼叫、每一次審批，以及每一次政策編輯，都會落入一份工作區範圍、可查詢的記錄——關聯回產生它的那次代理執行與工作階段。本頁說明如何把那份記錄當成一份 ai agent audit trail 來使用：從單一可疑執行，到你交給稽核員的一份簽署報告。

這裡的一切都是工作區範圍的。成員看見他們工作區的軌跡；沒有東西跨越租戶邊界。軌跡是由你已經設定的功能產生的——防護欄與防火牆——所以打開強制執行，就同時打開了鑑識。

1. 一份 ai agent audit trail 背後的四份記錄

歸因來自四條獨立的串流，每一條都關聯到同一個執行與工作階段，所以你可以在它們之間樞轉：

防護欄 Matches

在一個請求或回應上觸發的每一條內容規則——規則型別、動作、介面，以及一個細節字串。Member 可讀。

防火牆 Events 與 Runs

每一個工具呼叫裁決——allow、audit、deny、sanitize、 pending_approval（保留待審批），以及一條 cap_cost 規則解析後的裁決——按代理執行與工作階段彙整。Developer+。

審批決策

誰核准或拒絕了每一個被保留的工具呼叫，記錄為一個稽核動作。

政策變更歷史

每一次防護欄與防火牆編輯——版本控制、可比對、可回復——加上每次變更一筆工作區稽核列。

連結組織是代理執行與工作階段 id。來自同一次對話的一個防護欄匹配與一個防火牆事件攜帶相同的執行譜系，所以「這個執行遮罩了一個電子郵件、接著試了一次我們拒絕的擷取、然後被核准做一次寫入」讀起來像一個故事，而不是三份斷開的日誌。

2. 防護欄 Matches——什麼被審查了（Member）

每次一條防護欄規則觸發，閘道就寫一個匹配。這個動態住在 Guardrails 頁面（Matches 分頁），任何工作區成員都可讀。每個匹配記錄規則型別、所採取的動作（block / mask / flag / annotate / spotlight）、介面（input / output）、一個細節字串，以及觸發它的請求的執行譜系。把它列出、按防護欄或規則型別分組、按動作篩選、鑽進一個匹配，或把該動態匯出成 CSV。

匹配到的子字串（實際的電子郵件、那個 SSN）只在防護欄的 Log raw content 開關打開時才會被記錄——而它預設關閉，這是隱私保守的姿態。在它關閉時，你會得到一條規則觸發了以及它的細節元字串，但拿不到原始值。當你需要那個子字串來做分流時，逐防護欄打開它；該設定不溯及既往。

一條吵雜的規則也是軌跡的一部分。用 POST /api/guardrail/match/:id/mark-fp（Admin）把一個匹配標記為誤報，這樣你的訊號保持乾淨，而你的報告不會多計。

3. 防火牆 Events 與 Runs——代理做了什麼（Developer+）

當 Matches 涵蓋文字時，防火牆 Events 涵蓋動作。每一次工具呼叫評估都被記錄下來，帶有它的裁決、介面、工具名稱，以及——關鍵地——它所屬的 代理執行與工作階段。對 Events、Runs/sessions 彙整，以及逐執行追蹤的讀取需要 Developer+；較輕的 Discovered-tools 與異常動態對每個 Member 開放。 Runs & sessions 檢視是鑑識的主力：它把事件按代理執行彙整成一個裁決細分、該執行觸及的不同工具與模型，以及首次／最近一次出現的時間戳——一個螢幕上「這個代理實際上做了什麼」的答案。在靜態裁決之外，異常動態會標記偏離每個工作區習得的週小時基線 （一個 14 天滾動平均）的偏差——速率與成本飆升、retry_loop 與 novel_path 轉移——所以一個被允許但異常的模式仍會在記錄中浮現。

4. 審批決策——誰說了好（稽核動作）

當一條規則解析為 pending_approval 時，被保留的呼叫成為一次頻道外審查（參見防火牆的 HITL 流程）。那個決策是軌跡的一部分：核准或拒絕會寫一筆工作區稽核列—— firewall_approval_approve 或 firewall_approval_reject——指名那位行為者。決策是先寫者勝出且具冪等性，而如果底層規則在保留之後變更過，豐富化資訊會記下情境已經改變。所以一個被保留然後被核准的工具呼叫從頭到尾完全可歸因：防火牆事件顯示那次保留、稽核列顯示誰放行了它，而兩者都關聯到同一個執行。

5. 政策變更稽核——誰改了規則

一份代理行為軌跡只有在你也能證明當時的政策是什麼——以及誰改了它——時才可信。 防護欄保留一份完整的版本歷史。每一次建立、更新與刪除都會在與變更相同的交易中寫一筆版本控制的歷史列。在一個防護欄上開啟 History 以看見每個版本連同作者與時間戳、比對（diff）任兩個，並回復（revert） 到一個較舊的（回復被記錄為一個新版本——歷史永不被改動）。 防火牆政策、規則與設定變更各自會在變更提交之後寫一筆工作區稽核列 ——firewall_policy_update、firewall_rule_create、 firewall_settings_update 等等——而自主等級變更（firewall_autonomy_applied / firewall_autonomy_undone）會捕捉驅動一鍵還原的變更前狀態快照。密鑰與規則 blob 永不被記錄。

兩個平面都記錄變更並且保持政策可逆。如果一次規則編輯造成了一次退步，政策變更軌跡會告訴你是哪次編輯以及誰做的——而你回滾它，無需重新部署任何東西。

6. 一個實作範例：追蹤一次可疑執行

假設一次執行因一個非預期的外送呼叫被標記。從主控台，以一個 Developer+ 工作階段：

在 Firewall → Runs 中開啟該執行

用它的 id 找到該執行。彙整顯示它呼叫的每個工具以及每個的裁決——包括那個標記了它的擷取形狀工具上的 deny。

樞轉到事件

鑽進那個被拒絕的事件。它攜帶工具名稱、匹配到的規則與原因、介面，以及執行／工作階段譜系——你將用來對齊防護欄那一側的同一個譜系。

檢查同一個執行上什麼被審查了

開啟 Guardrails → Matches 並篩選到那個執行。如果一條 Secrets Blocker 或 PII 規則在提示詞上觸發了，你現在就知道在代理試圖外洩之前，它被遞交了敏感素材。

確認政策當時有效

開啟防護欄上的 History 以及防火牆政策的稽核列。確認在該執行之前沒有人削弱了相關規則——而如果有人這麼做了，你會有作者與時間戳。

一次執行、四份關聯記錄，無需 log-grep 考古。關於外洩防禦本身，參見資料外洩與危險的工具呼叫。

7. 簽署的合規報告——一份稽核員能驗證的軌跡

為了外部證明，Compliance 介面把這份軌跡變成一個單一成品。瀏覽框架目錄、包與就緒度對每個 Member 開放且免費；安裝一個包、產生一份報告、上線，以及設定資料駐留是付費方案上的工作區 Admin 動作（伺服器把關）。一份合規報告經 Ed25519 簽署，帶有一個 SHA256 內容雜湊，並 可公開驗證——接收者無需一個 OrcaRouter 帳戶就能檢查它：

端點	用途
`GET /api/public/compliance/pubkey`	用於驗證的公鑰。
`POST /api/public/compliance/verify`	驗證一份報告的簽章 + 雜湊。
`GET /api/public/compliance/share/:token`	一個指向報告的稽核員分享連結。

報告匯出為 CSV / JSON / PDF。框架包括 soc2、hipaa、gdpr、 iso_27001、iso_42001、nist_ai_rmf、pci_dss、EU AI Act （eu_ai_act），以及 OWASP Top 10 for LLM Applications（owasp_llm）等等——安裝一個包會物化對應的防護欄與防火牆政策，這樣你報告的控制就是實際強制執行的控制。

資料駐留在這裡指的是報告成品的區域（us / eu / uk / ap / cn / global），可透過 PUT /api/compliance/residency（Admin）設定；跨區域讀取會被扣住。它治理證據成品住在哪裡——它不是你推論流量的地理釘住。

8. 保留與被遺忘權

一份鑑識記錄是有界的，而不是永久的。請求日誌預設保留 30 天，並被伺服器夾制到 180 天的硬上限。當一位使用者自行刪除時，會套用一個 30 天寬限視窗，之後他們的 PII 會被清洗，而級聯會清除他們的防護欄 matches、請求日誌與防火牆事件——滿足被遺忘權／DSAR 義務，同時保持彙整的稽核歷史完好。

9. 下一步去哪裡

防護欄參考

Matches、原始內容記錄、版本歷史，以及完整的規則集。

防火牆參考

Events、Runs、異常、審批，以及稽核日誌。

過度代理權

在一個代理行動之前約束它被允許做什麼。

強制執行模式

Audit、shadow 與 observe——如何在你強制執行之前建立一份軌跡。

​1. 一份 ai agent audit trail 背後的四份記錄

防護欄 Matches

防火牆 Events 與 Runs

審批決策

政策變更歷史

​2. 防護欄 Matches——什麼被審查了（Member）

​3. 防火牆 Events 與 Runs——代理做了什麼（Developer+）

​4. 審批決策——誰說了好（稽核動作）

​5. 政策變更稽核——誰改了規則

​6. 一個實作範例：追蹤一次可疑執行

​7. 簽署的合規報告——一份稽核員能驗證的軌跡

​8. 保留與被遺忘權

​9. 下一步去哪裡

防護欄參考

防火牆參考

過度代理權

強制執行模式

1. 一份 ai agent audit trail 背後的四份記錄

2. 防護欄 Matches——什麼被審查了（Member）

3. 防火牆 Events 與 Runs——代理做了什麼（Developer+）

4. 審批決策——誰說了好（稽核動作）

5. 政策變更稽核——誰改了規則

6. 一個實作範例：追蹤一次可疑執行

7. 簽署的合規報告——一份稽核員能驗證的軌跡

8. 保留與被遺忘權

9. 下一步去哪裡