メインコンテンツへスキップ
個人データをアップストリームモデルから締め出したいとします。顧客が email アドレスを貼り付け、サポートトランスクリプトがカード番号を運び、エージェント プロンプトが SSN を漏らす — そしてそのどれもが OpenAI、Anthropic、Google に 平文で到達すべきではありません。PII Shield はそれを修正する最速の方法です: リクエスト内の機密エンティティを検出し、ゲートウェイが呼び出しを転送する前に 各々を型付きタグにマスクする、ワンルールのガードレールプリセットです。 これは PII マスキングのユースケースに焦点を当てた着地ページです。完全な ガードレールエンジン — すべてのルールの種類、フィールド、ルート — については、 ガードレールリファレンスを参照してください。

1. ひとつのルールで PII リダクション LLM ユースケース

PII リダクション LLM の配管の難しい部分は、たいてい配管そのものです。PII Shield はそれを取り除きます。プリセットは単一の pii ルールです:
  • Type: PII detection(pii
  • Action: Mask — 各マッチを型付きタグで置換
  • Entities: emailphonessncredit_cardip
コンソールで一度適用し、キーにアタッチすれば、そのキーでのすべての呼び出しが SDK 変更なし、再デプロイなしでスクリーニングされます。ポリシーはアプリケーション ではなくゲートウェイに存在します — あなたのアプリは以前と全く同様に /v1/chat/completions を呼び出し続けます。
入力ステージのマスキングがライブパスです。 PII Shield はリクエストが ゲートウェイを離れる前にマスクするため、アップストリームモデルが元の値を見る ことはありません。モデル出力とストリーミングレスポンスのライブマスキングは ロードマップ上です。PII Shield を、戻ってくるものではなく、送るものをスクラブする ものとして捉えてください。今日モデルのレスポンスをゲートするには、出力 block ルールが両方で強制されます — 出力ステージルールストリーミングカバレッジを参照。

2. コンソールでプリセットを適用する

ここでのすべてのステップは、あなた自身のセッション下の、ホスト型ゲートウェイ上の コンソールアクションです。ガードレールの作成と編集にはワークスペースで Developer+ が必要です。最後の /v1/* 呼び出しのみが sk-orca-... リレーキーを 使います。
1

テンプレートを開く

コンソールで Guardrails を開き、New guardrail スプリットボタンを クリックし、PII テンプレートカテゴリから PII Shield を選びます。 単一のマスキング pii ルールをシードします。
2

名前を付けて保存する

名前(≤ 64 文字)を付け、例:pii-shield、保存します。プリセットはシードで あり、ロックではありません — 後でエンティティリストやアクションを自由に編集 します。
3

テストする

Test タブを開き、input ステージでサンプルを貼り付け、ポリシーを ローカルで実行します — アップストリーム呼び出しなし、クォータなし (§4を参照)。
4

キーをアタッチする

API キーを編集し、Guardrail ドロップダウンから pii-shield を選ぶ (キー上に guardrail_id を設定)か、ワークスペースデフォルトとして マークします。キーにアタッチするアカウントデフォルトを参照。

3. 何が、何にマスクされるか

mask アクションでは、各マッチが型付きタグで置換されます — email は [EMAIL] に、SSN は [SSN] になります。組み込み検出器セットはクローズドで、エンジン、 サンドボックス、ルールビルダーで共有されます:
emailphonecredit_cardssnipibanmac_addressjwtaws_access_keyapi_key_openaibitcoin_address
jp_mynumber(日本のマイナンバー → [JP_MYNUMBER])、kr_rrn(韓国の 住民登録番号 → [KR_RRN])、cn_resident_id(中国の居民身分証 → [CN_RESIDENT_ID])。あなたの管轄区に合うものを有効化します。
組み込みの上に正規表現検出器を重ねます — employee_id、内部アカウント番号 — オプションの luhn チェックサムとカスタム置換つきで。ルールごとに最大 25 個カスタム PII エンティティマスキングフォーマットを参照。
ひとつの PII ルールは entity_actions を介して異なるエンティティに異なる アクションを適用できます — email / phone / ip をマスクしつつ、 credit_card または ssn では block します。重なり合うルールは不要です。 アクションを参照。

4. アタッチする前にテストする

いずれかのキーがそれを指す前に、ルールが期待どおりに動作することを証明します。 エディタ内の Test タブを開き、サンプルを貼り付け、input ステージを選んで 実行します:
Reply to jane@acme.com please
サンドボックスは現在のポリシーをローカルで評価し、判定とレンダリングされた テキストを返します — アップストリームには何も送信されず、何もメータリングされません:
Reply to [EMAIL] please
コーパスに対する A/B グリッドについては、 Eval ハーネスが隣のタブにあります。

5. リクエストを送信する

pii-shield にバインドされたキーを使って、以前と全く同様に OrcaRouter を 呼び出します — 新しいヘッダーなし、SDK 変更なし:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
ゲートウェイは転送前に email を [EMAIL] にマスクします — アップストリームモデルは Reply to [EMAIL] please を受け取り、アドレスを決して見ません。
エンティティのアクションを(エンティティごとのオーバーライドで)block に 切り替えると、そのエンティティを運ぶ次のリクエストは HTTP 400 guardrail_blocked で拒否されます。ブロックされたリクエストはクォータを 消費せず(入力ブロックはメータリングの前に発火)、skip-retry とマークされます。 guardrail_blocked エラーを参照。

6. 何が発火したかを確認する

発火したすべてのルールはマッチを記録します — ルールの種類、アクション、 ステージ、detail 文字列 — ワークスペースの Matches フィードに現れます。 マッチした部分文字列そのもの(実際の email アドレス)は、Log raw content が オンのときのみ記録され、それはデフォルトでオフです — リダクトされた PII を あなた自身のテレメトリからも締め出すプライバシー保守的な姿勢です。
リダクション制御では、Log raw content をオフのままにすることがたいてい要点 です:email がマスクされたこととその頻度を、たった今スクラブした値を再 キャプチャすることなく確認できます。トリアージのために部分文字列が必要なときだけ ガードレールごとにオンにします。設定は非遡及的です。 マッチフィードロギングとプライバシーを参照。

7. 次にどこへ

カスタム PII エンティティ

オプションの Luhn チェックつきで独自の正規表現検出器を、ルールごとに最大 25 個追加します。

マスキングフォーマット

各エンティティがレンダリングする型付きタグを制御します。

シークレットをブロック

Secrets Blocker プリセットで API キーとクレデンシャルを捕捉します。

誤検知のチューニング

Matches フィードから誤検知をマークし、検出器を引き締めます。
PII Shield はコンテンツをマスクします。エージェントのツール呼び出しを 統制するには — 破壊的アクションを deny し、ツール呼び出し引数をリダクトし、承認を 要求する — ファイアウォールを使います。 AI エージェントのセキュリティデータ持ち出しの脅威から始めるか、 完全なエンジンについてはガードレールリファレンスを 読んでください。