1. AI ガードレールテンプレートライブラリが提供するもの
プリセットは、完全なPolicy(1 つ以上の順序付けられたルール)を作成モーダルに
落とす、名前付きの出発点です。プリセットはサーバーサイドで作成されているため、
コンソールピッカー、Test サンドボックス、
そしてこのドキュメントは、すべて全く同じ挙動を記述します — 真実のソースはひとつ
です。
すべてのプリセットはシードであり、ロックではありません。ひとつ適用すると、
あなたがそのコピーを所有します:名前を変更したり、ルールを追加または削除したり、
ルールのアクションや
ステージを変更したり、検出器を再調整
したり。元のテンプレートについて何も、あなたの編集を制約しません。
プリセットの適用は、すべてのガードレール作成と同様に、自分のワークスペース
セッション下のコンソール アクションであり、ガードレールの作成や編集には
ワークスペースで Developer+ が必要です。最後の
/v1/* リレー呼び出しのみが
sk-orca-... キーを使います。2. プリセットカテゴリ
ピッカーは、プリセットを 8 つのカテゴリにグループ化します。各々が、そうでなければ 手で構築する一般的な制御にマッピングされます:PII — 個人データをリダクトまたはブロック
PII — 個人データをリダクトまたはブロック
email、phone、SSN、カード、IP などを検出してマスク(またはブロック)します。
1 ルールのマスキングには PII Shieldから、
PII がプロバイダに決して届いてはならない場合は厳格なブロッカーから始めます。
シークレット — クレデンシャルをプロンプトから排除
シークレット — クレデンシャルをプロンプトから排除
AWS / OpenAI / GitHub キー、PEM 秘密鍵、クラウドトークン、暗号通貨ウォレット
アドレスを、ゲートウェイを離れる前にブロックします。
シークレットのブロックを参照してください。
コンプライアンス — 規制データのレール
コンプライアンス — 規制データのレール
PCI カードブロック、EU/UK 識別子ブロック、医療識別子ブロック、そして
トラフィックを変えずに PII の出現を記録する observe-only な
コンプライアンスロガー。
ブランド — 拒否リストとブランドセーフティ
ブランド — 拒否リストとブランドセーフティ
安全性 — インジェクション、jailbreak、自傷
安全性 — インジェクション、jailbreak、自傷
プロンプトインジェクションのフレーズ、jailbreak / ロールプレイのパターン、
システムプロンプト漏洩の検出、自傷の拒否リストに対する keyword/regex のレール。
プロンプトインジェクションを参照してください。
コスト — サイズと長さの上限
コスト — サイズと長さの上限
コストとレイテンシを境界づけるための、リクエストプロンプトとモデルレスポンスへの
max_chars 上限。コストガードレールを
参照してください。エージェント — エージェント向けコンテンツフィルター
エージェント — エージェント向けコンテンツフィルター
エージェントフロー向けの URL フィルター、markdown 画像ブロック(画像持ち出し
防御)、シェルインジェクションパターン、出力内 SQL インジェクションフィルター。
エージェント向けガードレールを
参照してください。
コードセキュリティ — シークレット、ライセンス、リスクのある API
コードセキュリティ — シークレット、ライセンス、リスクのある API
.env / シークレットファイルの代入ブロック、リクエストとモデル出力に対する
強いコピーレフトライセンス(GPL / AGPL / LGPL / SSPL)のフラグ、そして高リスクの
シンク(eval、os.system、pickle.loads)を参照するプロンプトに注釈を付ける
非ブロッキングのアドバイザリ。
コードセキュリティを参照してください。3. プリセットをシードとして適用する
ここでのすべてのステップはコンソール アクションです。リレーキーは、最後の リクエストでのみ現れます。テンプレートピッカーを開く
コンソールで Guardrails を開き、New guardrail スプリットボタンを
クリックします。ピッカーは、上記の 8 つのカテゴリでグループ化されて開きます。
プリセットを選ぶ
ひとつ選びます — 例:PII カテゴリから PII Shield。それは完全なポリシー
(ここでは、単一のマスキング
pii ルール)をシードします。ピッカーは各プリセットの
説明を表示するため、適用する前にそれが何をするか分かります。名前を付けて自由に編集する
名前(≤ 64 文字)を付けます。シードされたルールは今やあなたのものです — それらの
いずれも追加、削除、再調整できます。プリセットはシードであり、ロックではありません。
アタッチする前にテストする
Test タブを開き、サンプルを貼り付け、ステージを選び、ポリシーをローカルで
実行します — アップストリーム呼び出しなし、クォータなし。どのキーもそれを指す前に、
期待どおりに動作することを証明します。
キーをアタッチする
API キーを編集し、Guardrail ドロップダウンからガードレールを選びます
(キーに
guardrail_id を設定します)か、ワークスペース デフォルトに
マークします。キーにアタッチと
アカウントデフォルトを参照してください。4. 具体例 1 つ:シードして、それから強制する
PII Shield プリセットを適用します。それはちょうど 1 つのルールをシードします:[EMAIL] にマスクします。カード番号を含む
リクエストは HTTP 400 guardrail_blocked で拒否されます — これはクォータを
消費せず(入力 block はメータリングの前に発火します)、skip-retry と
マークされます。guardrail_blocked エラーを
参照してください。
5. 適用した後 — 残りはエンジン
プリセットは、ルールを作成する素早い方法にすぎません。下流のすべては、通常の ガードレールエンジンです:| 得られるもの | どこで |
|---|---|
| ルールごとのアクション | アクション |
| テスト + eval | テストと eval |
| 何が発火したか | Matches フィード |
| 変更をロールバック | バージョニング |
ガードレールへのすべての create、update、delete — プリセットを適用して保存する
瞬間を含む — は、バージョン付きの履歴行を書き込みます。任意の 2 つのバージョンを
diff し、以前のものに revert できるため、シードされたポリシーの編集は
決して一方通行のドアではありません。
バージョニングを参照してください。
6. 次に進む先
PII Shield
ワンクリックの PII マスキングプリセット、最初から最後まで。
シークレットのブロック
Secrets Blocker プリセット — リクエスト内のキーとクレデンシャルを捕捉します。
エージェント向けガードレール
エージェントフロー向けの URL、markdown 画像、シェル、SQL フィルター。
ガードレールリファレンス
完全なエンジン — すべてのルールの種類、フィールド、ルート。
