ポリシーを作成してキーにアタッチする

api.orcarouter.ai でエージェントが使うキーがあり、そのキーが行うすべてのツール呼び出しを統制したい — ブロック、audit、サニタイズ、承認のための保留 — エージェントのコードに触れることなく。それが 2 ステップのエージェントファイアウォールセットアップです：ファイアウォールポリシーを一度作成し、キーをそれに向けます。次の呼び出しから、キーが発行するすべてのツールがゲートウェイでポリシーに対してチェックされます。このページは作成・アタッチのパスです。完全なポリシーモデル（サーフェス、判定、解決）についてはファイアウォールの概要を、ルール文法についてはファイアウォールルールを参照してください。

すべてのポリシーとキーの設定はコンソール（または /api/workspace/firewall/* 管理ルート。これらはセッション / アクセストークンを使い、リレーの sk-orca-… キー ではありません）で行われます。エージェントの /v1/* 呼び出しのみがリレーキーを使います。ポリシーの作成とアタッチは Developer+ のアクションです。

1. エージェントファイアウォールセットアップ概観

ファイアウォールポリシーは名前付きの、ワークスペーススコープのオブジェクトです：順序付けられたルールのリストと、どのルールもマッチしないすべてのための デフォルト判定です。キーはその firewall_policy_id フィールドを通じてポリシーにオプトインします。スタックの他の何も変わりません。

ポリシーを作成

名前を付け、デフォルト判定を選び、ルールを追加 — または自律性レベル / プリセットからシードして編集します。

キーをアタッチ

キーの firewall_policy_id をポリシーに設定するか、ポリシーをワークスペースデフォルトにマークして、すべてのアタッチされていないキーがそれを継承するようにします。

2. コンソールでポリシーを作成する

Security → Firewall → Policies を開き、New policy を選びます。
名前を付け（ワークスペース内で一意）、Enabled をオンのままにします。
デフォルト判定を選びます — §3 を参照。
ルールエディタでルールを追加するか、空のまま開始して後で Discovered tools に実トラフィックからの作成を駆動させます。
保存します。ポリシーは存在しますが、キーがそれに向けられるか、ワークスペースデフォルトにするまで何も統制しません。

最初にルールを手作成したくない？自律性レベルを適用します（balanced が推奨される開始点です） — 実在する編集可能なポリシーおよびガードレール行を具現化し、後でチューニングできます。または組み込みのプリセットからルールを開始して編集します。いずれにせよ、同じ場所に辿り着きます：キーにアタッチする名前付きポリシーです。

3. デフォルト判定を選ぶ

デフォルト判定は、ポリシーがどのルールもマッチしないツール呼び出しに対して行うことです。それはあなたの姿勢の床です。ちょうど 3 つの値を受け入れます：

`default_verdict`	どのルールもマッチしないとき…
`audit` (デフォルト)	呼び出しを許可しますが、記録します。すべてを観察し、何もブロックしません — 安全な開始点。
`allow`	許可してログ、レビューレコードなし。
`deny`	ルールが明示的に許可しないものをブロック — allow ルールと組み合わせるデフォルト deny の姿勢。

deny はデフォルト deny です：ルールが明示的に許可しないツール呼び出しはブロックされます。強力ですが、許可リストし忘れた呼び出しを止めてしまいます。デフォルト deny のポリシーはまずシャドウモードのもとでロールアウトし、強制する前に events フィードを監視してください。

ルールが生成できる判定（allow、audit、deny、sanitize、 pending_approval、cap_cost）は判定でカバーされています — デフォルト判定は上記の 3 つに限定されます。

4. ポリシーをキーにアタッチする

キーはその firewall_policy_id を通じてポリシーにオプトインします。コンソールで：

Keys を開き、エージェントが使うキーを編集します。
Firewall policy を作成したポリシーに設定します（これは firewall_policy_id を書き込みます）。
保存します。そのキーが行う次の呼び出しが統制されます。

バインディングはキー上、ゲートウェイ内にあります — エージェントは同じ Authorization: Bearer sk-orca-… と同じリクエストボディを送り続けます。エージェントのツール呼び出しコードに変更はありません。

# Your agent's relay call is unchanged. The attached policy is enforced
# at the gateway before any tool call in the response is dispatched.
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "delete the staging table"}],
    "tools": [{"type": "function", "function": {"name": "db.query"}}]
  }'

ルールが inbound サーフェスでツール呼び出しを deny すると、その呼び出しはツールと理由を名指しするコード firewall_blocked の HTTP 400 として返ってきます — ブロックがどう見えるかを参照。

5. 解決：アタッチ済み → ワークスペースデフォルト

任意のツール呼び出しについて、ゲートウェイはこの順序でどのポリシーが適用されるかを解決します：

1. キーのアタッチ済みポリシー

呼び出し元キーの firewall_policy_id が存在し有効なポリシーを指している場合、そのポリシーが適用されます。

2. ワークスペースデフォルト

それ以外の場合、ワークスペースの有効な is_default ポリシーが適用されます（設定されている場合）。ワークスペースごとに最大ひとつのポリシーがデフォルトになれます；新しいデフォルトをプロモートすると、同じトランザクション内で古いものが降格されます。

3. どちらもなし → 強制なし

アタッチメントもデフォルトもないということはポリシーがないことを意味します。観察モードがオンの場合、呼び出しは許可されカバレッジギャップとしてログされます；オフの場合、呼び出しはサイレントに許可されます。

無効化されたアタッチ済みポリシーはワークスペースデフォルトにフォールバックします — 強制をオフにはしません。（これはガードレールとは異なります。ガードレールでは無効化されたアタッチメントはnone に解決されます。）キーをファイアウォールのスコープから外すには、それをデタッチします（firewall_policy_id を 0 に設定）、ポリシーをただ無効にするのではなく。

ポリシーを、アタッチされていないすべてのキーのデフォルトにするには、キーを 1 つずつアタッチするのではなく、それを編集してワークスペースデフォルトに設定します — ポリシーの管理を参照。

6. 効果を確認する

それに依存する前に、ポリシーが期待どおりに発火することを確認します：

テストする — サンドボックスの Test タブはサンプルのツール呼び出しに対してポリシーをドライランし、判定、マッチしたルール、理由を返します。何もディスパッチも永続化もされません。ルールのテストを参照。
events フィードを監視する — キーがライブトラフィックを受け取ると、 Events が各評価を、判定、サーフェス、ツール、実行でフィルタ可能に表示します。

強制ポリシーはまずシャドウモードの背後でロールアウトします：本番と全く同様に評価しログを取りますが、すべての強制判定を audit に格下げし、理由に [shadow] would … を前置します。events フィードが期待どおりのものに発火し、そうでないものには発火しないことを示したら、シャドウをオフにします。

次に進む場所

ルールの作成

完全なマッチング言語 — ツールグロブ、引数句、egress リスト、サニタイザ。

ツール許可リスト

deny デフォルト判定を明示的な allow ルールと組み合わせます。

ポリシーの管理

デフォルト、有効化/無効化、バージョニング、リバート。

ゼロトラストの理由

テキストだけでなくアクションを統制することがなぜエージェントにとって重要か。

ポリシーが止めるべき脅威については、危険なツール呼び出しと過剰なエージェンシーを参照してください。

​1. エージェントファイアウォールセットアップ概観

ポリシーを作成

キーをアタッチ

​2. コンソールでポリシーを作成する

​3. デフォルト判定を選ぶ

​4. ポリシーをキーにアタッチする

​5. 解決：アタッチ済み → ワークスペースデフォルト

​6. 効果を確認する

​次に進む場所

ルールの作成

ツール許可リスト

ポリシーの管理

ゼロトラストの理由

1. エージェントファイアウォールセットアップ概観

2. コンソールでポリシーを作成する

3. デフォルト判定を選ぶ

4. ポリシーをキーにアタッチする

5. 解決：アタッチ済み → ワークスペースデフォルト

6. 効果を確認する

次に進む場所