メインコンテンツへスキップ
手で regex や PII エンティティリストを書くことなく、コンテンツポリシーを素早く 配置したい。テンプレートライブラリはその近道です:ユースケースごとにグループ化 された、すぐに使えるガードレールプリセットのセットで、各々がワンクリックで動作する ポリシーをシードします。ひとつ選んで名前を付ければ、キーにアタッチできる完全な 順序付けられたルールセットが手に入ります — あるいは先に編集します。 これはプリセットのユースケースに焦点を当てたランディングページです。完全な ガードレールエンジン — すべてのルールの種類、フィールド、アクション、ルート — に ついては、ガードレールリファレンスを参照してください。

1. AI ガードレールテンプレートライブラリが提供するもの

プリセットは、完全な Policy(1 つ以上の順序付けられたルール)を作成モーダルに 落とす、名前付きの出発点です。プリセットはサーバーサイドで作成されているため、 コンソールピッカー、Test サンドボックス、 そしてこのドキュメントは、すべて全く同じ挙動を記述します — 真実のソースはひとつ です。 すべてのプリセットはシードであり、ロックではありません。ひとつ適用すると、 あなたがそのコピーを所有します:名前を変更したり、ルールを追加または削除したり、 ルールのアクションステージを変更したり、検出器を再調整 したり。元のテンプレートについて何も、あなたの編集を制約しません。
プリセットの適用は、すべてのガードレール作成と同様に、自分のワークスペース セッション下のコンソール アクションであり、ガードレールの作成や編集には ワークスペースで Developer+ が必要です。最後の /v1/* リレー呼び出しのみが sk-orca-... キーを使います。

2. プリセットカテゴリ

ピッカーは、プリセットを 8 つのカテゴリにグループ化します。各々が、そうでなければ 手で構築する一般的な制御にマッピングされます:
email、phone、SSN、カード、IP などを検出してマスク(またはブロック)します。 1 ルールのマスキングには PII Shieldから、 PII がプロバイダに決して届いてはならない場合は厳格なブロッカーから始めます。
AWS / OpenAI / GitHub キー、PEM 秘密鍵、クラウドトークン、暗号通貨ウォレット アドレスを、ゲートウェイを離れる前にブロックします。 シークレットのブロックを参照してください。
PCI カードブロック、EU/UK 識別子ブロック、医療識別子ブロック、そして トラフィックを変えずに PII の出現を記録する observe-only な コンプライアンスロガー
冒涜的表現、競合への言及、地域固有の禁止用語に対するキーワード拒否リスト — block または mask。ブランドセーフティ機密語を参照してください。
プロンプトインジェクションのフレーズ、jailbreak / ロールプレイのパターン、 システムプロンプト漏洩の検出、自傷の拒否リストに対する keyword/regex のレール。 プロンプトインジェクションを参照してください。
コストとレイテンシを境界づけるための、リクエストプロンプトとモデルレスポンスへの max_chars 上限。コストガードレールを 参照してください。
エージェントフロー向けの URL フィルター、markdown 画像ブロック(画像持ち出し 防御)、シェルインジェクションパターン、出力内 SQL インジェクションフィルター。 エージェント向けガードレールを 参照してください。
.env / シークレットファイルの代入ブロック、リクエストとモデル出力に対する 強いコピーレフトライセンス(GPL / AGPL / LGPL / SSPL)のフラグ、そして高リスクの シンク(evalos.systempickle.loads)を参照するプロンプトに注釈を付ける 非ブロッキングのアドバイザリ。 コードセキュリティを参照してください。
プリセットは決定的なルールの種類 — keyword、regex、PII、max-chars — のみを シードします。高度なルールの種類(外部ベンダー、 LLM judge、コンテキスト整合性)は、接続や あなたが選ぶモデルを必要とするため、テンプレートからではなく、ルールビルダーから 追加されます。

3. プリセットをシードとして適用する

ここでのすべてのステップはコンソール アクションです。リレーキーは、最後の リクエストでのみ現れます。
1

テンプレートピッカーを開く

コンソールで Guardrails を開き、New guardrail スプリットボタンを クリックします。ピッカーは、上記の 8 つのカテゴリでグループ化されて開きます。
2

プリセットを選ぶ

ひとつ選びます — 例:PII カテゴリから PII Shield。それは完全なポリシー (ここでは、単一のマスキング pii ルール)をシードします。ピッカーは各プリセットの 説明を表示するため、適用する前にそれが何をするか分かります。
3

名前を付けて自由に編集する

名前(≤ 64 文字)を付けます。シードされたルールは今やあなたのものです — それらの いずれも追加、削除、再調整できます。プリセットはシードであり、ロックではありません。
4

アタッチする前にテストする

Test タブを開き、サンプルを貼り付け、ステージを選び、ポリシーをローカルで 実行します — アップストリーム呼び出しなし、クォータなし。どのキーもそれを指す前に、 期待どおりに動作することを証明します。
5

キーをアタッチする

API キーを編集し、Guardrail ドロップダウンからガードレールを選びます (キーに guardrail_id を設定します)か、ワークスペース デフォルトに マークします。キーにアタッチアカウントデフォルトを参照してください。

4. 具体例 1 つ:シードして、それから強制する

PII Shield プリセットを適用します。それはちょうど 1 つのルールをシードします:
{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}
それは、すぐに使えるマスキングポリシーです。しかしプリセットはシードであるため、 即座にそれを厳格化できます — 例えば、エンティティごとのオーバーライドで 2 つの エンティティを block に切り替え、カードと SSN は完全に拒否しつつ、残りは マスクします:
{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}
保存し、キーにアタッチし、以前と全く同様にゲートウェイを呼び出します — SDK 変更 なし、再デプロイなし:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
ゲートウェイは転送前に email を [EMAIL] にマスクします。カード番号を含む リクエストは HTTP 400 guardrail_blocked で拒否されます — これはクォータを 消費せず(入力 block はメータリングの前に発火します)、skip-retry と マークされます。guardrail_blocked エラーを 参照してください。
PII Shield プリセットは both ステージのマスキングルールをシードしますが、 モデル出力とストリームされたレスポンスのライブマスキングはロードマップ上に あります — 入力ステージのマスキングがライブのパスです(ゲートウェイはモデルが 目にする前にリクエストをスクラブします)。今日モデルレスポンスをゲートするには、 出力 block ルールが、ストリーミングと非ストリーミングの両方で強制されます。 出力ステージのルールストリーミングカバレッジを参照してください。

5. 適用した後 — 残りはエンジン

プリセットは、ルールを作成する素早い方法にすぎません。下流のすべては、通常の ガードレールエンジンです:
得られるものどこで
ルールごとのアクションアクション
テスト + evalテストと eval
何が発火したかMatches フィード
変更をロールバックバージョニング
ガードレールへのすべての create、update、delete — プリセットを適用して保存する 瞬間を含む — は、バージョン付きの履歴行を書き込みます。任意の 2 つのバージョンを diff し、以前のものに revert できるため、シードされたポリシーの編集は 決して一方通行のドアではありません。 バージョニングを参照してください。

6. 次に進む先

PII Shield

ワンクリックの PII マスキングプリセット、最初から最後まで。

シークレットのブロック

Secrets Blocker プリセット — リクエスト内のキーとクレデンシャルを捕捉します。

エージェント向けガードレール

エージェントフロー向けの URL、markdown 画像、シェル、SQL フィルター。

ガードレールリファレンス

完全なエンジン — すべてのルールの種類、フィールド、ルート。
プリセットはコンテンツポリシーをシードします。エージェントのツール呼び出しを 統制する — 破壊的アクションを拒否し、ツール呼び出し引数をリダクトし、承認を要求 する — には、ファイアウォールAI エージェントのセキュリティから 始めます。2 つのレイヤーがどう作業を分担するかについては、 ガードレール vs. ファイアウォールを 参照してください。