1. ひとつのルールで PII リダクション LLM ユースケース
PII リダクション LLM の配管の難しい部分は、たいてい配管そのものです。PII Shield
はそれを取り除きます。プリセットは単一の pii ルールです:
- Type: PII detection(
pii) - Action: Mask — 各マッチを型付きタグで置換
- Entities:
email、phone、ssn、credit_card、ip
/v1/chat/completions を呼び出し続けます。
入力ステージのマスキングがライブパスです。 PII Shield はリクエストが
ゲートウェイを離れる前にマスクするため、アップストリームモデルが元の値を見る
ことはありません。モデル出力とストリーミングレスポンスのライブマスキングは
ロードマップ上です。PII Shield を、戻ってくるものではなく、送るものをスクラブする
ものとして捉えてください。今日モデルのレスポンスをゲートするには、出力 block
ルールが両方で強制されます — 出力ステージルールと
ストリーミングカバレッジを参照。
2. コンソールでプリセットを適用する
ここでのすべてのステップは、あなた自身のセッション下の、ホスト型ゲートウェイ上の コンソールアクションです。ガードレールの作成と編集にはワークスペースで Developer+ が必要です。最後の/v1/* 呼び出しのみが sk-orca-... リレーキーを
使います。
テンプレートを開く
コンソールで Guardrails を開き、New guardrail スプリットボタンを
クリックし、PII テンプレートカテゴリから PII Shield を選びます。
単一のマスキング
pii ルールをシードします。名前を付けて保存する
名前(≤ 64 文字)を付け、例:
pii-shield、保存します。プリセットはシードで
あり、ロックではありません — 後でエンティティリストやアクションを自由に編集
します。テストする
Test タブを開き、
input ステージでサンプルを貼り付け、ポリシーを
ローカルで実行します — アップストリーム呼び出しなし、クォータなし
(§4を参照)。キーをアタッチする
API キーを編集し、Guardrail ドロップダウンから
pii-shield を選ぶ
(キー上に guardrail_id を設定)か、ワークスペースデフォルトとして
マークします。キーにアタッチすると
アカウントデフォルトを参照。3. 何が、何にマスクされるか
mask アクションでは、各マッチが型付きタグで置換されます — email は[EMAIL]
に、SSN は [SSN] になります。組み込み検出器セットはクローズドで、エンジン、
サンドボックス、ルールビルダーで共有されます:
組み込みエンティティ
組み込みエンティティ
email、phone、credit_card、ssn、ip、iban、mac_address、
jwt、aws_access_key、api_key_openai、bitcoin_address。地域固有の識別子
地域固有の識別子
jp_mynumber(日本のマイナンバー → [JP_MYNUMBER])、kr_rrn(韓国の
住民登録番号 → [KR_RRN])、cn_resident_id(中国の居民身分証 →
[CN_RESIDENT_ID])。あなたの管轄区に合うものを有効化します。独自のカスタムエンティティ
独自のカスタムエンティティ
組み込みの上に正規表現検出器を重ねます —
employee_id、内部アカウント番号 —
オプションの luhn チェックサムとカスタム置換つきで。ルールごとに最大
25 個。カスタム PII エンティティと
マスキングフォーマットを参照。4. アタッチする前にテストする
いずれかのキーがそれを指す前に、ルールが期待どおりに動作することを証明します。 エディタ内の Test タブを開き、サンプルを貼り付け、input ステージを選んで
実行します:
5. リクエストを送信する
pii-shield にバインドされたキーを使って、以前と全く同様に OrcaRouter を
呼び出します — 新しいヘッダーなし、SDK 変更なし:
[EMAIL] にマスクします — アップストリームモデルは
Reply to [EMAIL] please を受け取り、アドレスを決して見ません。
6. 何が発火したかを確認する
発火したすべてのルールはマッチを記録します — ルールの種類、アクション、 ステージ、detail 文字列 — ワークスペースの Matches フィードに現れます。 マッチした部分文字列そのもの(実際の email アドレス)は、Log raw content が オンのときのみ記録され、それはデフォルトでオフです — リダクトされた PII を あなた自身のテレメトリからも締め出すプライバシー保守的な姿勢です。リダクション制御では、Log raw content をオフのままにすることがたいてい要点
です:
email がマスクされたこととその頻度を、たった今スクラブした値を再
キャプチャすることなく確認できます。トリアージのために部分文字列が必要なときだけ
ガードレールごとにオンにします。設定は非遡及的です。
マッチフィードと
ロギングとプライバシーを参照。7. 次にどこへ
カスタム PII エンティティ
オプションの Luhn チェックつきで独自の正規表現検出器を、ルールごとに最大
25 個追加します。
マスキングフォーマット
各エンティティがレンダリングする型付きタグを制御します。
シークレットをブロック
Secrets Blocker プリセットで API キーとクレデンシャルを捕捉します。
誤検知のチューニング
Matches フィードから誤検知をマークし、検出器を引き締めます。
