PII Shield で PII をリダクトする

個人データをアップストリームモデルから締め出したいとします。顧客が email アドレスを貼り付け、サポートトランスクリプトがカード番号を運び、エージェントプロンプトが SSN を漏らす — そしてそのどれもが OpenAI、Anthropic、Google に平文で到達すべきではありません。PII Shield はそれを修正する最速の方法です：リクエスト内の機密エンティティを検出し、ゲートウェイが呼び出しを転送する前に各々を型付きタグにマスクする、ワンルールのガードレールプリセットです。これは PII マスキングのユースケースに焦点を当てた着地ページです。完全なガードレールエンジン — すべてのルールの種類、フィールド、ルート — については、ガードレールリファレンスを参照してください。

1. ひとつのルールで PII リダクション LLM ユースケース

PII リダクション LLM の配管の難しい部分は、たいてい配管そのものです。PII Shield はそれを取り除きます。プリセットは単一の pii ルールです：

Type: PII detection（pii）
Action: Mask — 各マッチを型付きタグで置換
Entities: email、phone、ssn、credit_card、ip

コンソールで一度適用し、キーにアタッチすれば、そのキーでのすべての呼び出しが SDK 変更なし、再デプロイなしでスクリーニングされます。ポリシーはアプリケーションではなくゲートウェイに存在します — あなたのアプリは以前と全く同様に /v1/chat/completions を呼び出し続けます。

入力ステージのマスキングがライブパスです。 PII Shield はリクエストがゲートウェイを離れる前にマスクするため、アップストリームモデルが元の値を見ることはありません。モデル出力とストリーミングレスポンスのライブマスキングはロードマップ上です。PII Shield を、戻ってくるものではなく、送るものをスクラブするものとして捉えてください。今日モデルのレスポンスをゲートするには、出力 block ルールが両方で強制されます — 出力ステージルールとストリーミングカバレッジを参照。

2. コンソールでプリセットを適用する

ここでのすべてのステップは、あなた自身のセッション下の、ホスト型ゲートウェイ上の コンソールアクションです。ガードレールの作成と編集にはワークスペースで Developer+ が必要です。最後の /v1/* 呼び出しのみが sk-orca-... リレーキーを使います。

テンプレートを開く

コンソールで Guardrails を開き、New guardrail スプリットボタンをクリックし、PII テンプレートカテゴリから PII Shield を選びます。単一のマスキング pii ルールをシードします。

名前を付けて保存する

名前（≤ 64 文字）を付け、例：pii-shield、保存します。プリセットはシードであり、ロックではありません — 後でエンティティリストやアクションを自由に編集します。

テストする

Test タブを開き、input ステージでサンプルを貼り付け、ポリシーをローカルで実行します — アップストリーム呼び出しなし、クォータなし（§4を参照）。

キーをアタッチする

API キーを編集し、Guardrail ドロップダウンから pii-shield を選ぶ（キー上に guardrail_id を設定）か、ワークスペースデフォルトとしてマークします。キーにアタッチするとアカウントデフォルトを参照。

3. 何が、何にマスクされるか

mask アクションでは、各マッチが型付きタグで置換されます — email は [EMAIL] に、SSN は [SSN] になります。組み込み検出器セットはクローズドで、エンジン、サンドボックス、ルールビルダーで共有されます：

組み込みエンティティ

email、phone、credit_card、ssn、ip、iban、mac_address、 jwt、aws_access_key、api_key_openai、bitcoin_address。

地域固有の識別子

jp_mynumber（日本のマイナンバー → [JP_MYNUMBER]）、kr_rrn（韓国の住民登録番号 → [KR_RRN]）、cn_resident_id（中国の居民身分証 → [CN_RESIDENT_ID]）。あなたの管轄区に合うものを有効化します。

独自のカスタムエンティティ

組み込みの上に正規表現検出器を重ねます — employee_id、内部アカウント番号 — オプションの luhn チェックサムとカスタム置換つきで。ルールごとに最大 25 個。カスタム PII エンティティとマスキングフォーマットを参照。

ひとつの PII ルールは entity_actions を介して異なるエンティティに異なるアクションを適用できます — email / phone / ip をマスクしつつ、 credit_card または ssn では block します。重なり合うルールは不要です。アクションを参照。

4. アタッチする前にテストする

いずれかのキーがそれを指す前に、ルールが期待どおりに動作することを証明します。エディタ内の Test タブを開き、サンプルを貼り付け、input ステージを選んで実行します：

Reply to jane@acme.com please

サンドボックスは現在のポリシーをローカルで評価し、判定とレンダリングされたテキストを返します — アップストリームには何も送信されず、何もメータリングされません：

Reply to [EMAIL] please

コーパスに対する A/B グリッドについては、 Eval ハーネスが隣のタブにあります。

5. リクエストを送信する

pii-shield にバインドされたキーを使って、以前と全く同様に OrcaRouter を呼び出します — 新しいヘッダーなし、SDK 変更なし：

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

ゲートウェイは転送前に email を [EMAIL] にマスクします — アップストリームモデルは Reply to [EMAIL] please を受け取り、アドレスを決して見ません。

エンティティのアクションを（エンティティごとのオーバーライドで）block に切り替えると、そのエンティティを運ぶ次のリクエストは HTTP 400 guardrail_blocked で拒否されます。ブロックされたリクエストはクォータを消費せず（入力ブロックはメータリングの前に発火）、skip-retry とマークされます。 guardrail_blocked エラーを参照。

6. 何が発火したかを確認する

発火したすべてのルールはマッチを記録します — ルールの種類、アクション、ステージ、detail 文字列 — ワークスペースの Matches フィードに現れます。マッチした部分文字列そのもの（実際の email アドレス）は、Log raw content がオンのときのみ記録され、それはデフォルトでオフです — リダクトされた PII をあなた自身のテレメトリからも締め出すプライバシー保守的な姿勢です。

リダクション制御では、Log raw content をオフのままにすることがたいてい要点です：email がマスクされたこととその頻度を、たった今スクラブした値を再キャプチャすることなく確認できます。トリアージのために部分文字列が必要なときだけガードレールごとにオンにします。設定は非遡及的です。マッチフィードとロギングとプライバシーを参照。

7. 次にどこへ

カスタム PII エンティティ

オプションの Luhn チェックつきで独自の正規表現検出器を、ルールごとに最大 25 個追加します。

マスキングフォーマット

各エンティティがレンダリングする型付きタグを制御します。

シークレットをブロック

Secrets Blocker プリセットで API キーとクレデンシャルを捕捉します。

誤検知のチューニング

Matches フィードから誤検知をマークし、検出器を引き締めます。

PII Shield はコンテンツをマスクします。エージェントのツール呼び出しを統制するには — 破壊的アクションを deny し、ツール呼び出し引数をリダクトし、承認を要求する — ファイアウォールを使います。 AI エージェントのセキュリティとデータ持ち出しの脅威から始めるか、完全なエンジンについてはガードレールリファレンスを読んでください。

​1. ひとつのルールで PII リダクション LLM ユースケース

​2. コンソールでプリセットを適用する

​3. 何が、何にマスクされるか

​4. アタッチする前にテストする

​5. リクエストを送信する

​6. 何が発火したかを確認する

​7. 次にどこへ

カスタム PII エンティティ

マスキングフォーマット

シークレットをブロック

誤検知のチューニング

1. ひとつのルールで PII リダクション LLM ユースケース

2. コンソールでプリセットを適用する

3. 何が、何にマスクされるか

4. アタッチする前にテストする

5. リクエストを送信する

6. 何が発火したかを確認する

7. 次にどこへ