/api/guardrail/* ルートと対話します。このページは
ルート単位のガードレール API リファレンスです:すべてのエンドポイント、それが
必要とするワークスペースロール、そして期待される認証です。
ガードレールが何であるか、そしてルールがどう構成されるかについては、
ガードレールを読んでください。このページはワイヤレベルの
コンパニオンです。
1. 認証とスコープ
すべての/api/guardrail/* ルートは管理プレーンです:リレーキーではなく、
コンソールセッションまたはアクセストークン(コンソールにログインするのと同じ
アイデンティティ)で認証します。
- ルートはワークスペーススコープです — アクティブなワークスペースのガードレール だけを見ます。テナント境界を越えるものは何もありません。
- すべてのルートは、あなたのワークスペースロール (Viewer / Developer / Admin / Owner)によって RBAC ゲートされます。読み取りは Viewer+ に開放;サンドボックスとすべての書き込みは Developer+ が必要; 誤検知エンドポイントは Admin(Admin または Owner)が必要です。
ほとんどのチームはこれらのルートを直接呼び出すことはありません — コンソールが
それらすべてを駆動します。ガードレールをソース管理に、CI に、あるいは自分の
ツールに配線したいときに REST サーフェスに手を伸ばしてください。
2. ひとつの具体的な呼び出し — ガードレールを一覧する
読み取りは、始めるのに最もシンプルな場所です。任意のワークスペースメンバー (Viewer+)として認証します:3. ひとつのテーブルで見るロールモデル
ルートではなく、あなたが取るアクションがティアを選びます。| アクション | 最小ロール |
|---|---|
| 読み取り(一覧/取得、履歴、マッチ、評価実行)、評価を実行 | Viewer+ |
| サンドボックステストを実行 | Developer+ |
| 作成、更新、削除、リバート、コーパスのアップロード/削除 | Developer+ |
| マッチを誤検知としてマーク / マーク解除 | Admin |
guardrails:read 権限(Viewer 以上が保持)にマップされ;書き込みは
guardrails:write(Developer 以上)にマップされます。誤検知のマークには追加で
Admin ロールが必要です。ロールと権限がどう組み合わさるかについては、
スコープ、キー、ポリシーを
参照してください。
4. エリア別のルート
ガードレール(CRUD + サンドボックス)
ガードレール(CRUD + サンドボックス)
| メソッドとパス | ロール |
|---|---|
GET /api/guardrail/ | Viewer+ |
GET /api/guardrail/meta | Viewer+ |
GET /api/guardrail/my-permissions | 任意のメンバー |
GET /api/guardrail/:id | Viewer+ |
GET /api/guardrail/:id/tokens | Viewer+ |
POST /api/guardrail/test | Developer+ |
POST /api/guardrail/ | Developer+ |
PUT /api/guardrail/ | Developer+ |
DELETE /api/guardrail/:id | Developer+ |
meta はエンジンの語彙 — ルールタイプ、ステージ、アクション、PII エンティティ、
プリセット、プリセットカテゴリ — を返すため、ツールは enum をハードコードせずに
フォームを構築できます。test は現在のポリシーをサンプルテキストに対して
サンドボックスで実行します:何も永続化されず、何もアップストリームへ行きません。バージョン履歴
バージョン履歴
| メソッドとパス | ロール |
|---|---|
GET /api/guardrail/:id/history | Viewer+ |
GET /api/guardrail/:id/history/diff | Viewer+ |
GET /api/guardrail/:id/history/:version | Viewer+ |
POST /api/guardrail/:id/revert | Developer+ |
revert は古いバージョンを新しいバージョンとして前方にコピーします — 履歴が
変更されることは決してありません。評価とコーパス
評価とコーパス
| メソッドとパス | ロール |
|---|---|
POST /api/guardrail/:id/eval | Viewer+ |
GET /api/guardrail/:id/eval/runs | Viewer+ |
GET /api/guardrail/eval/runs/:run_id | Viewer+ |
GET /api/guardrail/eval/corpora | Viewer+ |
POST /api/guardrail/eval/corpora | Developer+ |
GET /api/guardrail/eval/corpora/:id | Viewer+ |
DELETE /api/guardrail/eval/corpora/:id | Developer+ |
Matches フィード
Matches フィード
| メソッドとパス | ロール |
|---|---|
GET /api/guardrail/match | 任意のメンバー |
GET /api/guardrail/match/grouped | 任意のメンバー |
GET /api/guardrail/match/stats | 任意のメンバー |
GET /api/guardrail/match/export | 任意のメンバー |
GET /api/guardrail/match/cap-status | 任意のメンバー |
GET /api/guardrail/match/:id | 任意のメンバー |
POST /api/guardrail/match/:id/mark-fp | Admin |
DELETE /api/guardrail/match/:id/mark-fp | Admin |
mark-fp ルートは
Admin のみ(Admin または Owner)でレート制限されています。5. 解決:どのガードレールが適用されるか
上記のルートはポリシーを管理します;解決は、所与のリレー呼び出しでどれが走るかを 決定します。これは明示的またはデフォルトモデルであり、明示的なアタッチメントに サイレントなフォールバックはありません:- キーの明示的
guardrail_id→ そのガードレールが適用されます、ただしそれが 存在し有効である場合。無効化されたアタッチメントはオフスイッチです — それは フォールバックしません。 - アタッチメントなし → ワークスペースの有効なデフォルトガードレール(
is_default)。 - どちらもなし → 強制なし。リクエストは、この機能を一度も有効化していない ワークスペースとバイト単位で同一です。
guardrail_id を設定します;0/null は
「明示的なアタッチメントなし」を意味します。
6. ブロックが返すもの
block アクションのルールが発火すると、リレー呼び出し(/v1/*、あなたのリレーキー上)
— これらの管理ルートではなく — は次を返します:
| フィールド | 値 |
|---|---|
| HTTP ステータス | 400 |
| エラーコード | guardrail_blocked |
| クォータコスト | 入力ステージのブロックは事前消費の前に発火するため、クォータは課金されない |
| リトライ | skip-retry とマーク |
7. アクション、ステージ、ルールタイプ一覧
meta ルートはこれらを enum として返します;ここに簡易リファレンスとして示します。
- アクション:
block(拒否、HTTP 400)、mask(マッチをリダクトし、 クリーニングされたテキストを転送)、flag(ログのみ — トラフィックを変えずに 観察)、annotate(非ブロッキング — マッチを記録し、モデルが答える前にそれを 知らせるための人間可読なノートをアップストリームに注入)、spotlight(非ブロッキング — マッチした信頼されていないスパンをデリミタで包み、それを指示ではなくデータとして 扱うようモデルに伝える;プロンプトインジェクション防御、実際には入力ステージ)。 - ステージ:
input(リクエスト)、output(モデルのレスポンス)、またはboth。 - ルールタイプ:
keyword、regex、pii、max_chars、external、llm_judge、grounding。
出力ステージのルールは、ストリーミングと非ストリーミングの両方のレスポンスで
強制されます:
block はストリームを切り、mask はチャンクが流れる中でマッチした
スパンを帯域内で書き換えます。ストリームでは、すでにフラッシュされたバイトは撤回
できないため、マッチは十分にバッファされたときにのみ作用されます — 最も強い保証の
ためには、input ステージでスキャンしてください。これはモデルが見る前にリクエストを
サニタイズします。まず正確なステージ/ストリームの組み合わせをサンドボックスで証明
してください。8. 関連リファレンス
ファイアウォール API
アクションプレーンのピア —
/api/workspace/firewall/* とゲートウェイルート。コンプライアンス API
/api/compliance/* — パック、署名付きレポート、レジデンシー、レディネス。エラーコード
すべての
*_blocked コード、その HTTP ステータス、そして何をすべきか。ガードレール(詳細)
ルールタイプ、PII エンティティ、プリセット、評価、そしてマッチフィードを完全に。
