1. ガードレールのプライバシーロギング:デフォルトでオフ
すべてのガードレールは、ポリシーごとの単一のトグル Log raw content を持ち、 それはオフで出荷されます。それがオフの場合、マッチは発火したもののメタデータを 記録しますが、違反するテキストをフィードにコピーすることは決してありません:トグルがオフのときに記録される
ルールの種類、アクション、ステージ、そして短い詳細文字列 —
pii ルールが
リクエスト上で email をマスクしたことを、アドレスを保存せずに知るのに十分です。オンのときにのみ追加される
マッチした部分文字列 — ルールが捕捉したリテラルなテキスト。トグルを
有効化した後に記録されたマッチに対してのみキャプチャされます。
デフォルトでオフがプライバシー保守的な姿勢です。 マッチした部分文字列は、
ガードレールがログしうる最も機密性の高いものです — それは定義上、ルールが捕捉
するために存在するデータです。OrcaRouter は、ガードレールごとにオプトインしない
限り、それを保存しません。
2. マッチ記録が保持するもの
マッチは、小さなワークスペーススコープの診断記録です。Log raw content が オフの場合、メタデータのみを保持します:| フィールド | 例 | トグルがオフのとき存在するか? |
|---|---|---|
| ルールの種類 | pii、regex、keyword | はい |
| アクション | block、mask、flag | はい |
| ステージ | input、output | はい |
| 詳細 | 短い分類文字列(例:エンティティ) | はい |
| マッチした部分文字列 | jane@acme.com | オンのときのみ |
3. 具体例 1 つ
リクエスト上でemail をマスクする pii ルールを持つガードレールを取り上げ、
キーにアタッチします。呼び出し元が送信します:
[EMAIL] にマスクし、マッチがフィードに
着地します。そのマッチが何を含むかは、完全にトグルに依存します:
Log raw content オフ(デフォルト)
Log raw content オフ(デフォルト)
マッチは記録します:ルールの種類
pii、アクション mask、ステージ input、
そして email エンティティを示す詳細文字列。それは jane@acme.com を
保存しません。email がリクエスト上でマスクされたことは分かりますが、
フィードから email を読み戻すことはできません。Log raw content オン
Log raw content オン
同じマッチが、加えてマッチした部分文字列 —
jane@acme.com — を持つため、
トリアージパス中にルールが捕捉したものを正確に確認できます。4. それをオンにする(そして非遡及的保証)
Log raw content はガードレールごとの設定です。ガードレールの編集は、自分の セッション下のコンソール アクションであり、ワークスペースで Developer+ が 必要です — 最後の/v1/* 呼び出しのみが sk-orca-... リレーキーを使います。
Log raw content を有効化する
Log raw content トグルをオンにして保存します。保存はバージョン付きの履歴行を
書き込むため、変更は監査可能で revert 可能です —
バージョニングを参照してください。
5. オンのときに何がキャプチャされるか
Log raw content がオンのとき、エンジンは各違反にリテラルなマッチテキストを 添付しますが、ひとつの病的な入力が単一のマッチ記録を膨れ上がらせないよう、2 つの ハードキャップがあります:- 違反ごとに最大 32 のマッチエントリ。
- 各エントリは 256 文字に制限されます。
トグルがオンでも、ガードレールはルールが実際にマッチしたテキストしか決して
記録しません。周囲のプロンプトとレスポンスの残りは、決して Matches フィードに
コピーされません。完全なリクエスト / レスポンスのペイロードは、ガードレール診断とは
別個の関心事です。
6. すでにキャプチャした部分文字列を削除する
トグルが非遡及的であるため、それをオフにしても、以前の部分文字列はそのままです。 2 つの面がそれらをクリアします:| 削除したいもの | 方法 |
|---|---|
| ノイジーなマッチ 1 つ | それを誤検知としてマークします — POST /api/guardrail/match/:id/mark-fp(ワークスペース Admin)、またはフィードの Mark false positive アクション。 |
| あるユーザーのすべてのガードレールマッチ | ユーザーの自己削除は 30 日間の猶予ウィンドウをトリガーし、その後、ガードレールマッチ、リクエストログ、ファイアウォールイベントを通じてカスケードする PII スクラブを行います。コンプライアンスを参照してください。 |
7. 誰が何を読めるか
Matches フィードは、ワークスペーススコープの診断データです。読み取りアクセスは、 すべてのアクティブな member に開放されています。破壊的な誤検知アクションは、 より高くゲートされています:| アクション | ルート | ロール |
|---|---|---|
| マッチの一覧 / グループ化 / 統計 / エクスポート | GET /api/guardrail/match* | Member |
| 単一マッチ詳細 | GET /api/guardrail/match/:id | Member |
| 誤検知のマーク / マーク解除 | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| ガードレールの編集(Log raw content を含む) | PUT /api/guardrail/ | Developer+ |
8. 実用的なプライバシーデフォルト
ほとんどのワークスペースにとって適切な形はこうです:Log raw content をオフのまま にし、ガードレールをメタデータ上で実行し、ルールがなぜその挙動で発火するかを 能動的にデバッグしているときに、単一のポリシーに対してトグルを一時的にオンに します。それからオフに戻します — 新しいマッチは即座に部分文字列を運ばなくなります。9. 次に進む先
Matches フィード
記録されたすべてのマッチをブラウズ、グループ化、フィルター、エクスポートします。
誤検知のチューニング
マッチをマークして絞り込み、ノイジーなルールを静かにします。
バージョニング
すべてのトグルの反転は、バージョン付きで revert 可能な変更です。
コンプライアンス
保持、データ主体の消去、署名付きレポート。
