1. AI エージェント監査証跡の背後にある 4 つのレコード
帰属は 4 つの独立したストリームから来ます。それぞれが同じ実行とセッションに相関付け られているため、それらの間をピボットできます:ガードレール Matches
リクエストまたはレスポンスで発火したすべてのコンテンツルール — ルール型、アクション、
ステージ、詳細文字列。Member が読めます。
ファイアウォール Events & Runs
すべてのツール呼び出し判定 —
allow、audit、deny、sanitize、
pending_approval(承認のための保留)、そして cap_cost ルールの解決された判定 —
エージェント実行とセッションでロールアップ。Developer+。承認決定
保留された各ツール呼び出しを誰が承認または拒否したか、監査アクションとして記録。
ポリシー変更履歴
すべてのガードレールとファイアウォールの編集 — バージョン管理、差分可能、復帰可能 —
に加えて変更ごとのワークスペース監査行。
2. ガードレール Matches — 何がスクリーニングされたか(Member)
ガードレールルールが発火するたびに、ゲートウェイはマッチを書きます。フィードは Guardrails ページ(Matches タブ)に存在し、任意のワークスペースメンバーが読めます。 各マッチは、ルール型、取られたアクション(block / mask / flag /
annotate / spotlight)、ステージ(input / output)、詳細文字列、そして
それをトリガーしたリクエストの実行系統を記録します。それを一覧化し、ガードレールや
ルール型でグループ化し、アクションでフィルタし、1 つのマッチにドリルダウンし、フィードを
CSV にエクスポートできます。
ノイズの多いルールも証跡の一部です。POST /api/guardrail/match/:id/mark-fp(Admin)で
マッチを誤検知としてマークし、シグナルをクリーンに保ち、レポートが過大カウントしない
ようにします。
3. ファイアウォール Events & Runs — エージェントが何をしたか(Developer+)
Matches がテキストをカバーする一方、ファイアウォール Events はアクションを カバーします。すべてのツール呼び出し評価が、その判定、サーフェス、ツール名、そして — 決定的に — それが属するエージェント実行とセッションとともにログされます。Events、 Runs/sessions ロールアップ、実行ごとのトレースの読み取りには Developer+ が必要です; より軽い Discovered-tools と異常フィードはすべての Member に開放されています。 Runs & sessions ビューはフォレンジックの主力です:イベントをエージェント実行ごとに、 判定の内訳、実行が触れた個別のツールとモデル、初回/最終の観測タイムスタンプにロール アップします — 「このエージェントが実際に何をしたか」の答えを 1 画面で。 静的な判定を超えて、異常フィードは、各ワークスペースの学習された曜日内時間 ベースライン(14 日間の移動平均)からの逸脱 — レートとコストのスパイク、retry_loop、novel_path 遷移 — をフラグするため、許可されたが異常なパターンも依然と
してレコードに表面化します。
4. 承認決定 — 誰がイエスと言ったか(監査アクション)
ルールがpending_approval に解決されると、保留された呼び出しは帯域外のレビューに
なります(ファイアウォールの HITL フローを
参照)。決定は証跡の一部です:承認または拒否はワークスペース監査行 —
firewall_approval_approve または firewall_approval_reject — を書き、アクターを名指し
します。決定はファーストライタウィンかつ冪等で、基礎となるルールが保留の後に変わった
場合、エンリッチメントはコンテキストが変わったことを記録します。
そのため、保留されてから承認されたツール呼び出しは、エンドツーエンドで完全に帰属可能
です:ファイアウォールイベントが保留を示し、監査行が誰がそれを解放したかを示し、両方が
同じ実行に相関します。
5. ポリシー変更監査 — 誰がルールを変えたか
エージェントの挙動の証跡は、その時点でポリシーが何だったか — そして誰がそれを変えたか — も証明できる場合にのみ信頼できます。 ガードレールは完全なバージョン履歴を保持します。すべての作成、更新、削除が、変更と 同じトランザクションでバージョン管理された履歴行を書きます。ガードレールの History を 開いて、作者とタイムスタンプ付きのすべてのバージョンを見、任意の 2 つを差分し、 古いものに復帰します(復帰は新しいバージョンとして記録されます — 履歴は決して変異 されません)。 ファイアウォールのポリシー、ルール、設定の変更は、それぞれ変更がコミットされた後に ワークスペース監査行 —firewall_policy_update、firewall_rule_create、
firewall_settings_update など — を書き、自律性レベルの変更
(firewall_autonomy_applied / firewall_autonomy_undone)は、ワンクリック取り消しを
動かす前状態スナップショットを捕捉します。シークレットとルールブロブは決してログされません。
6. 実例:1 つの容疑実行をトレースする
ある実行が予期しないアウトバウンド呼び出しでフラグされたとします。コンソールから、 Developer+ セッションで:Firewall → Runs で実行を開く
実行をその id で見つけます。ロールアップは、それが呼び出したすべてのツールと、
それぞれの判定 — それをフラグしたフェッチ形状のツールへの
deny を含む — を示します。イベントにピボット
deny されたイベントにドリルダウンします。それはツール名、マッチしたルールと理由、
サーフェス、そして実行/セッション系統 — ガードレール側を整列させるために使うのと同じ
系統 — を運びます。
同じ実行で何がスクリーニングされたか確認
Guardrails → Matches を開き、その実行にフィルタします。Secrets Blocker や PII
ルールがプロンプトで発火していた場合、エージェントが持ち出そうとする前に機微素材を
手渡されたことが今わかります。
7. 署名されたコンプライアンスレポート — 監査人が検証できる証跡
外部の証明のために、Compliance サーフェスはこの証跡を単一のアーティファクトに変えます。 フレームワークカタログ、パック、準備状況の閲覧はすべての Member に開放され無料 です;パックのインストール、レポートの生成、ライブ化、データレジデンシーの設定は、 有料プラン上のワークスペース Admin アクションです(サーバーゲート)。 コンプライアンスレポートは、SHA256 コンテンツハッシュ付きで Ed25519 署名 され、公開検証可能です — 受信者は OrcaRouter アカウントなしでそれをチェックします:| エンドポイント | 目的 |
|---|---|
GET /api/public/compliance/pubkey | 検証するための公開鍵。 |
POST /api/public/compliance/verify | レポートの署名 + ハッシュを検証。 |
GET /api/public/compliance/share/:token | レポートへの監査人共有リンク。 |
soc2、
hipaa、gdpr、iso_27001、iso_42001、nist_ai_rmf、pci_dss、EU AI Act
(eu_ai_act)、そして OWASP Top 10 for LLM Applications(owasp_llm)などが含まれ
ます — パックのインストールはマッチするガードレールとファイアウォールポリシーを具現化する
ため、レポートするコントロールが実際に強制されているコントロールになります。
ここでのデータレジデンシーは、レポートアーティファクトのリージョン(
us /
eu / uk / ap / cn / global)であり、PUT /api/compliance/residency(Admin)
経由で設定可能です;クロスリージョン読み取りは差し止められます。それは証拠アーティファクトが
どこに存在するかを統制します — あなたの推論トラフィックのジオピン留めではありません。8. 保持と消去権
フォレンジックレコードは有限であり、永遠ではありません。リクエストログはデフォルトで 30 日間の保持で、サーバーがハードな最大値 180 日にクランプします。ユーザーが 自己削除すると、30 日間の猶予ウィンドウが適用され、その後彼らの PII がスクラブされ、 カスケードが彼らのガードレールマッチ、リクエストログ、ファイアウォールイベントをパージ します — 集計監査履歴をそのまま保ちながら、消去権 / DSAR の義務を満たします。9. 次に進む先
ガードレールリファレンス
Matches、生コンテンツのログ、バージョン履歴、そして完全なルールセット。
ファイアウォールリファレンス
Events、Runs、異常、承認、そして監査ログ。
過剰なエージェンシー
エージェントが行動する前に、何をしてよいかを制約します。
強制モード
Audit、shadow、observe — 強制する前に証跡を構築する方法。
