プロバイダ注記：OpenAI vs Claude ネイティブストリーム

ファイアウォールポリシーをキーにアタッチすると、モデルがツール呼び出しをストリームで返し、response ステージがエージェントがそれに作用する前にそれを剥がすか書き換えます。強制決定はすべてのプロバイダで同一です — 同じルール、同じ判定、同じイベント。異なるのは、ファイアウォールがストリーミングされたツール呼び出しに作用した後にクライアントが見るワイヤーの形です。OpenAI chat、 OpenAI Responses API、ネイティブ Claude /v1/messages がそれぞれツール呼び出しを異なってフレーム化するからです。このページはそれらの顧客が観測可能な違いへの焦点を絞った注記です。ルール言語を再文書化はしません — ファイアウォールルールを参照 — ステージモデルも同様で、ステージでカバーされています。 3 つすべてが共有する内部の保持・再組み立てメカニズムについては、ストリーミング内部を読んでください。

1. なぜファイアウォールのプロバイダストリーミングがワイヤーで異なるか

非ストリームレスポンスでは、ファイアウォールは返信全体を一度に見て決定します。 ストリームでは、モデルのツール呼び出しは断片のシーケンスとして到着します — 1 つのフレームに名前、引数 JSON はさらに多くにまたがって少しずつ。判定は完全な呼び出し（名前と完全な引数）を必要とし、ツール呼び出しの断片は一度転送されると撤回できません。そのためすべてのプロバイダでゲートウェイは同じことをします：通常のコンテンツを ライブでストリームさせ、呼び出しが完全に組み立てられるまでツール呼び出しフレームを保持します。ストリーム終了時に各組み立てられた呼び出しを評価し、生き残ったもののみを — そのプロバイダ独自のイベント形で — 発行します。

テキストは決して停滞しません。 ツール呼び出しフレームのみが保持されます。アシスタントコンテンツ、推論、role フレームはライブで変更なくストリームされます。保持は最初のツール呼び出し断片からそのターンの終わりまで適用されます — そのためチャットのみのレスポンスはファイアウォールがアタッチされていないのと全く同様にストリームされます。

2. OpenAI chat completions

/v1/chat/completions では、ツール呼び出しはインデックスでキー付けられた delta.tool_calls 断片としてストリームされます。ゲートはそれら（とレガシーの delta.function_call 形）を保持し、終了フレームで、生き残った呼び出しをゼロから再インデックスして発行し、続いて finish フレームを発行します：

結果	クライアントが受け取るもの
allow	元の保持されたフレーム、バイト単位 — 真の通過。
sanitize	引数が書き換えられた 1 つの `tool_calls` デルタ、それから `finish_reason: "tool_calls"`。
deny（一部の呼び出し）	生き残った呼び出しのみ、それから `finish_reason: "tool_calls"`。
deny（すべての呼び出し）	ツール呼び出しなし、それから `finish_reason: "stop"` — ターンはモデルがテキストで答えることを選んだように見えます。

その最後の行がテスト対象となる手がかりです：ファイアウォールが OpenAI chat ターンから すべてのツール呼び出しを剥がすと、エージェントはエラーフレームではなくクリーンな finish_reason: "stop" を見ます。ループを「このターンはツール呼び出しなし」を有効な結果として扱うように構築してください。

3. OpenAI Responses API

ネイティブの /v1/responses ストリームは独自のイベントモデルを持ちます — ツール呼び出しは response.output_item.added で開き、response.function_call_arguments.delta 断片をストリームし、response.output_item.done で完了する function_call アイテムです。ファイアウォールは done、呼び出しが完全になる最初のポイントで評価します：

allow → バッファされたイベントがそのままフラッシュ

呼び出しがクリアされると、アイテムの added / argument-delta / done イベントが変更なく発行されます。

sanitize → アイテムシェル + 書き換えられた done

added シェルがストリームされ、それから引数がリダクト版である done が — 元の argument-delta 断片はドロップされるため、リダクトされていない値が決してあなたに到達しません。

deny → アイテムがどこからも削除

バッファされたイベントはドロップされ、deny されたアイテムは、クライアントが最終状態を構築する終端の response.completed オブジェクトからもフィルタアウトされます — 決して実行されなかった呼び出しへのぶら下がった参照はありません。

テキストと推論のデルタは、chat completions と全く同様に、全体を通じてライブでストリームされます。

4. ネイティブ Claude `/v1/messages`

ネイティブの Anthropic ストリームは異なる獣です：コンテンツはインデックス付きのブロックとして到着します — content_block_start → content_block_delta （input_json_delta 断片）→ content_block_stop — stop_reason を運ぶ message_delta で閉じられます。ファイアウォールは最初の tool_use ブロックから保持し、それぞれを評価し、生き残ったブロックを連続したインデックスで再構築するため、剥がされたブロックがインデックスのギャップを残しません。 Claude 固有の手がかりは stop_reason です。すべての tool_use ブロックが deny される場合、tool_use の stop_reason はクライアントに決して到着しないツール呼び出しを約束してしまう — そのためゲートウェイはそれを end_turn に書き換えます：

upstream:  content_block_start (tool_use) … message_delta {stop_reason: "tool_use"}
            ↓ firewall denies the only tool_use
client:    (no tool_use block)            … message_delta {stop_reason: "end_turn"}

部分的な剥がしは、生き残った tool_use ブロックを連続して再インデックスして保ち、 stop_reason: "tool_use" をそのまま残します。

これはネイティブの Claude ストリームに適用されます。OpenAI 形式のエンドポイント経由で呼び出された Claude モデルは代わりに OpenAI chat ワイヤー（§2）で強制されるため、 stop_reason: "end_turn" ではなく finish_reason: "stop" を表示します。ターン終了の処理を、基礎となるモデルではなく呼び出したワイヤーフォーマットに合わせてください。

5. 具体例 1 つ

同じルールはすべてのプロバイダで同じ決定を生成します — クライアントが読むワイヤーの形のみが異なります。response ステージで一度作成します：

{
  "stage": "response",
  "tool_name_glob": "shell.exec",
  "verdict": "deny",
  "args_match_json": "{\"clauses\":[{\"path\":\"$.command\",\"op\":\"regex\",\"value\":\"rm -rf|mkfs\"}]}"
}

同じプロンプトを 3 通りでストリームすると、ファイアウォールは毎回 rm -rf 呼び出しを deny します。クライアントが観測するもの：

ワイヤー	完全な剥がし後の終端シグナル
OpenAI chat	`finish_reason: "stop"`
OpenAI Responses	`response.completed` からアイテムが不在
ネイティブ Claude	`stop_reason: "end_turn"`

マッチして deny された呼び出しは、ワイヤーに関わらずファイアウォールイベントに同一に表示されるため、ストリームはそうでなくても可観測性はプロバイダに依存しません。

6. プロバイダをまたいで一定であるもの

ワイヤーは異なります；コントラクトは異なりません：

判定とルールはワイヤーに依存しません。 allow / audit / deny / sanitize はすべてのプロバイダで同じことを意味します。判定を参照。
サニタイズはツール呼び出しの引数のみを触ります。ツールが返すコンテンツは決して触りません — すべてのワイヤーで。レスポンスのサニタイズを参照。
allow は真の通過です。 ファイアウォールが何も作用しないとき、保持されたフレームは正確なアップストリームバイトとして再生されます — 再バッチなし、プロバイダ固有のフィールドの損失なし。
シャドウモードはどこでも適用されます。 それをオンにすると、保持されたツール呼び出しは常に生き残り（audit に格下げ）、ポリシーがトラフィックを変える前にプロバイダをまたいだその影響を測定できます。シャドウモードを参照。

7. これがどこに収まるか

ストリーミング内部

すべてのプロバイダが共有する保持・組み立て・再組み立てメカニズム。

ステージ

なぜストリーミングされたツール呼び出しの強制が response サーフェスに存在するか。

判定

ストリーミングされた呼び出しが解決するプロバイダに依存しない決定。

レスポンスフィルタリング

モデルが発行するツール呼び出しを、ストリームかどうかに関わらずゲート。

これらのストリーミングされたチェックが対処する脅威については、危険なツール呼び出しとデータ持ち出しを；ストリーム強制がリクエストパスのどこに位置するかについては、強制パスのレイテンシを参照してください。

​1. なぜファイアウォールのプロバイダストリーミングがワイヤーで異なるか

​2. OpenAI chat completions

​3. OpenAI Responses API

​4. ネイティブ Claude /v1/messages

​5. 具体例 1 つ

​6. プロバイダをまたいで一定であるもの

​7. これがどこに収まるか

ストリーミング内部

ステージ

判定

レスポンスフィルタリング

1. なぜファイアウォールのプロバイダストリーミングがワイヤーで異なるか

2. OpenAI chat completions

3. OpenAI Responses API

4. ネイティブ Claude `/v1/messages`

5. 具体例 1 つ

6. プロバイダをまたいで一定であるもの

7. これがどこに収まるか