ライブおよびストリーミングレスポンスのスキャン：カバレッジ

アプリがストリームする場合、コンテンツポリシーを信頼する前に、ひとつの率直な答えが必要です：SSE レスポンス上で実際に何が強制されるか。 全体のレスポンスを検査するガードレールは推論しやすく、デルタがブラウザにフラッシュされる際にそれらに対処しなければならないガードレールはそうではありません。このページはストリーミングガードレールカバレッジマトリクスです — すべてのアクション、入力と出力のステージにわたって、ストリーミングと非ストリーミングのトラフィック上で — ライブストリーム上で各セルがどう挙動するかについて正確であるよう書かれています。完全なエンジン — すべてのルールの種類、フィールド、ルート — についてはガードレールを参照してください。ストリームがどう打ち切られるかのメカニクスについては、ストリームセーフなルールを参照してください。

1. ストリーミングガードレールカバレッジの問い

ガードレールルールは、ステージ（input、output、または both）と アクション — 5 つのうちのひとつ：block、mask、flag、annotate、または spotlight — を持ちます。ステージはゲートウェイがそれをいつ実行するかを決め、アクションはそれが何をするかを決めます。ストリーミングが答えの形を変える唯一の場所は出力ステージです — なぜならそれが、ゲートウェイがバイトを到着するそばからクライアントに転送し、ペイロード全体を先に保持する機会のない唯一のステージだからです。そのためマトリクスには、ストリーミングが重要な 2 つのセルがあり、それらは異なる挙動をします：出力 block はストリーム上で完全に強制されます（スキャナがそれを打ち切ります）が、出力 mask は非ストリーミングレスポンスにのみ強制されます。ストリーミングレスポンスでは、スキャナは依然としてマッチを検出し、block の判断には対処できますが、今日はマスクされたテキストをストリームに書き換えることはしません — インバンドのストリーミング出力マスキングはロードマップ上にあります。

入力は決して問題ではありません。 入力ステージのルールは、モデルの前に走ります — ゲートウェイがリクエストをスクリーニングし（mask の場合は書き換え）、その後サニタイズされたバージョンをアップストリームに転送します。レスポンスがストリームするかどうかは無関係です。リクエストは、ゲートウェイが完全に保持する完結したペイロードです。入力スキャンは、すべてのリクエストで完全にライブ、マスキングを含むです。

2. カバレッジマトリクス

これを上から下へ読んでください。すべての block セルはライブで、ストリーミングを含みます — しかし output + mask + streaming が、ストリーム内でまだ強制されていない唯一のセルです：mask ルールは非ストリーミングレスポンスをリダクトしますが、ストリーミングレスポンスではデルタを書き換えずにマッチを検出します（ストリーム内出力マスキングはロードマップ上にあります）。

ステージ · アクション	非ストリーミング	ストリーミング
`input` · block	リクエストを拒否	リクエストを拒否
`input` · mask	リクエストを書き換え	リクエストを書き換え
`output` · block	レスポンスを拒否	ストリームを打ち切る
`output` · mask	レスポンスをリダクト	マッチを検出；ストリーム内ではリダクトしない（ロードマップ）
any · flag	記録のみ	記録のみ

annotate と spotlight は、トラフィックを拒否することなくノートを添付（またはマッチしたテキストを囲む）し、実際には入力ステージのアクションであるため、上記の出力 / ストリーミングのセルを変えません。それらは他のどのルールとも同様にマッチを記録します。

input — 完全にライブ、両方向（block + mask）

入力ステージのルールは、アップストリームモデルが走る前にリクエストをスクリーニングします。block は呼び出しを短絡します（HTTP 400 guardrail_blocked、メータリングの前なので、クォータを消費しません）。mask はプロンプト内のマッチしたフィールドをその場で書き換えます — サニタイズされたテキストがアップストリームに行くものであり、モデルが元のものを目にすることはありません。これらのどれも、レスポンスがストリームするかどうかには依存しません。

output · block — ストリーミングと非ストリーミングの両方で強制

非ストリーミングレスポンスでは、completion が返る前に完全にスクリーニングされます — block は HTTP 400 guardrail_blocked として表に出ます。ストリーミングレスポンスでは、ストリームスキャナがデルタが流れる際にそれを監視します。 block ルールが発火すると、それはストリームを打ち切り — スキャナを封印し、残りの代わりに短い置換通知を発し、さらなるブロック対象のコンテンツがクライアントに届く前に SSE チャネルを閉じます。200 SSE ヘッダーはその時点ですでに出ているため、ストリーミング block は 400 を返せません：block を HTTP エラーではなく、最終のインバンドデルタとして配信します。

output · mask — 非ストリーミングのみ（ストリーミングはロードマップ）

非ストリーミングレスポンスでは、mask ルールが completion を書き換え — 例： email が [EMAIL] になり — サニタイズされたテキストがクライアントが得るものになります。ストリーミングレスポンスでは、ストリームスキャナは依然としてマッチを検出してマスクを計算しますが、マスクされたテキストをデルタに転送 しません — マスクされた出力は破棄され、block の判断のみが実行されます。そのため、mask ルールは今日ストリーミングレスポンスをリダクトしません。インバンドのストリーミング出力マスキングはロードマップ上にあります。ストリームされたレスポンスから今すぐ PII を排除する必要がある場合は、ルールを block として作成する（スキャナがマッチでストリームを打ち切ります）か、非ストリーミングでスクリーニングしてください。

flag — 観察のみ、どこでも同一

flag ルールは決してトラフィックを変えません — マッチを記録し、バイトを通します。ステージとストリームはその挙動を変えません。block にプロモートする前に、ルールのヒット率を測定するために使います。

覚えるべき 1 行： 出力 block は両方のトランスポート上でライブで強制されます — ストリーミングを含む — そして入力マスキングは常にライブです。出力 mask は非ストリーミングレスポンスのみをリダクトします。ストリーム上では、マッチを検出しますが、まだデルタを書き換えません（ストリーム内出力マスキングはロードマップ上にあります）。ストリームされたレスポンスから今日 PII を排除するには、ルールを block として作成するか、非ストリーミングでスクリーニングします。

3. 具体例 1 つ — ストリームされたレスポンスから PII を排除する

モデルが RAG コンテキストから顧客の email を表に出しうる場合で、あなたのアプリがストリームするとします。出力 mask は今日ストリーム内でリダクトしません （ストリーム内出力マスキングはロードマップ上にあります） — そのため、ストリームされたレスポンスから PII を排除するには、出力ルールを block として作成します：スキャナはマッチが現れた瞬間にストリームを kill します。（出力 mask は非ストリーミングレスポンスではリダクトします。）ポリシー編集は、コンソールセッション上の管理アクションです（Developer+ にゲート）。sk-orca-... リレーキーは /v1/* トラフィックのみを送信し、ポリシーを決して編集しません。

/console/guardrails を開き、New guardrail、stream-pii-out と名付けます。
ルールを 1 つ追加します：
- Type: PII detection
- Stage: output
- Action: block ← マッチでストリームを打ち切る；ストリーム上では mask は検出のみ（非ストリーミングレスポンスをリダクトします）
保存し、その後 /console/token でキーの Guardrail ドロップダウンからアタッチします。

これで stream: true でゲートウェイを呼び出します、以前と全く同様に：

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Email the customer from the record above"}
    ]
  }'

デルタがマッチすると、スキャナはストリームを打ち切り、置換通知を発し、チャネルを閉じます — クライアントは残りを決して受け取りません。レスポンスがクリーンであれば、すべてのデルタは手つかずで通過します。

ストリーミング block はマッチの後のすべてを止めますが、マッチが着地する前にすでにフラッシュされたバイトを送信解除することはできません。1 バイトの違反するバイトも決してクライアントに届かないことをポリシーが要求する場合は、リクエストを 非ストリーミングでスクリーニングしてください。そこでは、ポリシーがクリアするまで completion 全体が保持されます。

4. マトリクス全体での PII Shield

PII Shield プリセットは、単一の pii ルール、アクション mask、ステージ both です。それをマトリクスにマッピングすると、カバレッジは §2 から期待されるとおりです：

入力ステージ — 完全にライブ、ストリーミングであるかどうか。リクエストはモデルが目にする前にマスクされます（入力マスキングの見出しとなる価値）。
出力ステージ、非ストリーミング — completion が返る前にマスクされます。
出力ステージ、ストリーミング — ストリームスキャナはマッチを検出しますが、今日はデルタを書き換えません。そのため、マスクされた形はストリームされたクライアントに届きません（ストリーム内出力マスキングはロードマップ上にあります）。

そのため、mask プリセットはそれ自体ではストリームされたレスポンスからの PII をカバーしません。ストリームされたレスポンスから PII を排除するには、そのルールを block として作成（または非ストリーミングで呼び出し）し、マッチでストリームが打ち切られるようにします。PII Shieldとマスキングフォーマットを参照してください。

5. ストリーミング block が何を消費するか

ストリーミング block は、どの出力 block とも同じ会計を持ちます — モデルはすでに走っているため、ゲートウェイが返金を処理します：

非ストリーミングレスポンスでは、呼び出しは発火したガードレールとルールを示す HTTP 400 guardrail_blocked を返します。ストリーミングレスポンスでは、 200 SSE ヘッダーがすでにワイヤー上にあるため、block は 400 の代わりに、最終のインバンド置換デルタとクリーンなチャネルクローズとして到着します。
クォータは課金されません。 入力 block はメータリングの前に発火します。出力 block（ストリーミングであるかどうか）は、レスポンスが拒否されると事前消費されたクォータを返金します。いずれにせよ呼び出し元は何も支払いません。
リクエストは skip-retry とマークされます — 同じプロンプトを再実行してもまたブロックされるだけなので、ゲートウェイは別のチャネルでのリトライを燃やしません。

発火したすべての出力ルールは、ワークスペースの Matches フィード（GET /api/guardrail/match、任意の Member に開放）にマッチも記録します。マッチした部分文字列は、ガードレールの Log raw content トグルがオンのときにのみキャプチャされます（デフォルトでオフ）。完全な詳細は guardrail_blocked エラーと Matches フィードに存在します。

6. 出荷前にステージ / アクションの組み合わせを証明する

どのマトリクスのセルがポリシーに適用されるか推測しないでください — それを検証します。どちらのツールも、管理 API を介してコンソールセッション上で実行されます：

Test タブ

各ガードレールエディタには Test タブがあります：サンプルを貼り付け、ステージを選び、アップストリーム呼び出しなし、クォータなしで現在のポリシーを実行します。判定と、mask ルールの場合はレンダリングされたテキストを確認します。 Test サンドボックスは Developer+ にゲートされています（有料の judge / grounding 呼び出しとアウトバウンド統合リクエストを発火しうるため）。

Eval タブ

Eval タブは、バンドルまたはカスタムの JSONL コーパスに対してガードレールをスコアリングします — キーをアタッチする前に、block ルールが既知の漏洩を捕捉することを確認するのに役立ちます。eval の実行には読み取りアクセス（viewer+）のみが必要です。

詳しくはテストと evalと誤検知のチューニングを参照してください。

7. 次に進む先

ストリームセーフなルール

スキャナが SSE ストリームを途中で打ち切る方法、そしてストリーミングトラフィック上で保たれるポリシーを作成する方法。

出力ステージ

モデルのレスポンスをスクリーニングする — block vs. mask、クォータ返金、そしてグラウンディング。

入力ステージ

モデルの前にリクエストをスクリーニングする — マスキングを含む、ストリーミングであるかどうか。

アクション

block、mask、flag、annotate、spotlight を詳しく — どれがいつ正しい選択か。

​1. ストリーミングガードレールカバレッジの問い

​2. カバレッジマトリクス

​3. 具体例 1 つ — ストリームされたレスポンスから PII を排除する

​4. マトリクス全体での PII Shield

​5. ストリーミング block が何を消費するか

​6. 出荷前にステージ / アクションの組み合わせを証明する