マルチテナント SaaS をセキュアにする

あなたは、多数の顧客テナントが 1 つのコードベースと 1 つの OrcaRouter ワークスペースを共有する SaaS を構築しています。各テナントはあなたのゲートウェイ経由でプロンプトを送り、エージェントを実行します。そして難しい問題は爆発半径です：漏洩したテナントキー、暴走するテナントエージェント、あるいはあるテナントの PII が別のテナントのログに着地することは、境界を越えてこぼれることが許されません。このレシピは、共有ゲートウェイをテナントセーフにする 3 つのコントロールを配線します — テナントごとのスコープキー、すべてのテナントが継承するワークスペースレベルのポリシー、そしてあるテナントがより多くを必要とするときのテナントごとのオーバーライド — すべてコンソールから、アプリケーションコードへの変更ゼロで。

ここにあるすべてはあなたのワークスペースにバインドされ、コンソールから設定されます。あなたのアプリは各テナントの sk-orca-... キーで https://api.orcarouter.ai/v1/chat/completions を呼び続けます — 変わるのはゲートウェイ内のポリシーだけです。設定アクションは各ステップで示されるロールを必要とします；テナントキーを使うのは /v1/* リレー呼び出しだけです。

1. マルチテナント AI セキュリティモデル

マルチテナントゲートウェイは、単一アプリとは異なる脅威の形を持ちます。重要なリスクはテナント数とともにスケールします：

キー漏洩 = 1 テナントの爆発半径

漏洩したテナントキーは、あなたのアカウントを枯渇させたり、公開していないモデルを呼び出したり、そのテナントの予算を超えて到達したりできるべきではありません。

テナント間のデータ漏れ

あるテナントの PII が共有ログに、あるいは別のテナントにルーティングされたレスポンスに着地することは、あなたのデータ分離の約束を破ります。

騒がしいテナントエージェント

あるテナントのエージェントがツールでループしたり、任意のホストを取得したりしても、他の全員のためにゲートウェイを劣化させるべきではありません。

テナントごとのコンプライアンス

規制対象のテナントは、他のテナントが必要としない PII マスキングとデータ residency を必要とするかもしれません。

下記のモデルは 2 つのレイヤーです：すべてのテナントキーが継承するワークスペースベースライン、加えて他に触れずに 1 つのテナントを締めるキーごとのスコープとオーバーライド。完全な解決ルールについてはスコープキー、ポリシー、ワークスペースを参照してください。

2. ベースライン：すべてのテナントが継承する 1 つのワークスペースポリシー

あなたのセキュリティ姿勢をワークスペースレベルで一度作成して、すべてのテナントキーがデフォルトでそれを継承するようにします — テナントごとの複製なし。

デフォルトガードレール

Guardrails → New guardrail で、1 つの名前付きポリシー（例：tenant-baseline）を作成し、ワークスペースデフォルト（is_default）としてマークします。PII ルールを、ステージ input、アクション mask で追加して、どのテナントのリクエストも生の PII をアップストリームに運ばないようにします：

{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "credit_card", "ssn", "ip"],
  "entity_actions": { "credit_card": "block", "ssn": "block" }
}

明示的なガードレールアタッチメントがないテナントキーは、このデフォルトにフォールバックします。ガードレールの作成には Developer ロールが必要です。

デフォルトファイアウォールポリシー

あなたのテナントがエージェントを実行するなら、アクションプレーンでも同じことをします：Firewall → Policies でデフォルトポリシーを作成するか — より速く — Firewall → Posture を開いて balanced 自律性レベルを適用します。これは最も破壊的なアクションを deny しながら、すべてのテナントのツール呼び出しを audit し、ワークスペース全体で PII を flag するため、広く強制する前に実際のテナントの振る舞いを観察できます。Developer ロール。

新しいルールがテナントを途中で壊せないよう、ベースラインを observe → shadow → enforce の順でロールアウトします。ファイアウォールポリシーはポリシーごとの shadow_mode フラグをサポートします（強制判定は [shadow] would … としてログ）；ガードレールルールは flag アクションで開始します。強制モードを参照。

3. テナントごとに 1 つのスコープキー

これがテナント分離の中核です：決してキーをテナント間で共有せず、決してテナントにアカウント全体のキーを渡さない。 テナントごとに 1 つのキーを発行し、そのテナントがしてよいことだけにスコープします。API Keys → New key で、次を設定します：

支出に上限をかける（デニアル・オブ・ウォレットの境界）

credit_limit_usd をそのテナントの上限に設定します（0 = 無制限）。これは唯一最も重要なマルチテナントコントロールです：漏洩した、または悪用されたテナントキーは、決してあなたのアカウントではなく、そのテナントの予算しか燃やせません。デニアル・オブ・ウォレットを参照。

モデルを固定する

model_limits（model_limits_enabled）をオンにし、そのテナントのプランに含まれるモデルだけをリストします — つまり漏洩したキーが、テナントが一度も支払っていない高価なモデルを実行できないようにします。

environment / テナントをラベル付けする

environment（自由形式のデプロイラベル、例：prod / staging）を設定して、テナントのトラフィックがあなたのログで帰属可能になり、本番キーとテストキーを一目で見分けられるようにします。

オリジンとライフタイムをロックダウンする

テナントが固定サーバーから呼び出す場合は allow_ips をそのテナントのバックエンド egress IP に設定し、トライアルまたは期間限定のテナントには expired_time を設定します（-1 = 無期限）。

すべてのテナントキーは、ワークスペースの tenant-baseline ガードレールとデフォルトファイアウォールポリシーを自動的に継承します — あなたはスコープキーを発行し、それは既に統制されています。キーは作成後に表示でマスクされるので、テナントをプロビジョンするときに一度だけコピーしてください。

4. テナントごとのオーバーライド — 残りに触れずに 1 つを締める

ほとんどのテナントはベースラインに乗ります。あるテナントがより多くを必要とするとき — 規制対象のテナント、エンタープライズ階層、保護観察リスト上のテナント — より厳格な名前付きポリシーをそのキーのみにアタッチします：

キーに設定	その 1 つのテナントへの効果
`guardrail_id`	より厳格な名前付きガードレールに差し替える（例：PII でブロック）。
`firewall_policy_id`	よりタイトなファイアウォールポリシーに差し替える（例：デフォルト deny ツール）。

解決は 2 つのプレーンで異なります — 違いを知ってください：

ガードレール：明示的なアタッチメントがオフスイッチ

明示的な guardrail_id（存在し有効なとき）は常に適用され、決してサイレントにフォールバックしません。そのアタッチされたガードレールが無効なら、キーはガードレールを持ちません — ワークスペースデフォルトには落ちません。 tenant-baseline デフォルトを継承するには guardrail_id を未設定（0/null）のままにします。

ファイアウォール：無効なアタッチメントはフォールバックする

アタッチされた firewall_policy_id は、存在し有効なときに適用されます；そのポリシーが無効なら、キーはワークスペースデフォルトファイアウォールポリシーにフォールバックします。（これはガードレールのオフスイッチの挙動とは逆です — 設計どおりです。）

名前付きポリシーを編集すると、次の呼び出しでそれにアタッチされたすべてのキーがシフトします。複数のテナントが 1 つのより厳格なポリシーを共有していると、編集は一度にそのすべてに当たります。テナントが本当に異なるルールを必要とするときは、1 つの巨大な共有ポリシーではなく、分離クラスごとに異なる名前付きポリシーを使ってください。

5. 具体的な 2 階層の例

1 つのワークスペースで無料階層と規制対象のエンタープライズ階層を運用するとします：

ワークスペースベースライン — tenant-baseline ガードレール（入力で PII マスク、カード/SSN でブロック）を is_default として、加えて balanced ファイアウォール自律性レベル。すべてのテナントがこれを継承します。
無料階層テナントキー — guardrail_id なし（ベースラインを継承）、model_limits を openai/gpt-4o-mini に固定、低い credit_limit_usd。
エンタープライズテナントキー — guardrail_id をより厳格な enterprise-pii ガードレールに設定（入力で PII block、mask ではなく；output ステージの secrets ブロック）、よりタイトなツール許可リストを持つ firewall_policy_id、より高いクレジット上限、そして allow_ips を彼らのバックエンドに固定。

両方の階層は、自分のキーで同じ /v1/chat/completions エンドポイントを呼び出します。ゲートウェイがキーごとに正しいポリシーを解決します — あなたのアプリケーションコードはすべてのテナントで同一です。

6. テナントごとのコンプライアンス & residency

規制対象のテナントは、しばしば他が必要としない証明を必要とします。コンプライアンスは、ガードレールとファイアウォールのワークスペースピアとして実行されます：

フレームワークカタログとレディネスのブラウジングは任意の Member に開放され、無料です — あるテナントが尋ねるフレームワーク（soc2、hipaa、gdpr、 iso_27001、pci_dss など）のカバレッジを確認します。
パックのインストール（POST /api/compliance/packs/:key/install）は、マッチするガードレールとファイアウォールポリシーをあなたのワークスペースに具現化します；ワークスペース Admin と有料プランが必要です。
データ residency は、PUT /api/compliance/residency（Admin）経由で、 あなたのコンプライアンスレポートアーティファクトの地域（us / eu / uk / ap / cn / global）を固定します。地域横断的な読み取りは差し止められます。

ここでの residency はコンプライアンスレポートアーティファクトを統制するものであり、推論データのジオ固定ではありません。リクエストログについて：ログはデフォルト 30 日保持され（180 日でハードキャップ）、ユーザーの自己削除は 30 日の猶予を経て、その後そのユーザーのガードレールマッチとリクエストログにカスケードする PII スクラブを実行します。

完全に監査されたエビデンス実行については、 SOC 2 エビデンスを生成すると HIPAA 向けにデプロイするを参照してください。

7. すべてのテナントを 1 つのワークスペースから監視する

すべての可観測性はワークスペーススコープなので、1 セットのフィードがあなたの全テナントをカバーします — 単一のものまでフィルタ可能です：

Guardrails → Matches（任意の Member） — すべてのテナントにわたって発火したすべてのルール：type、action、stage、detail。マッチした部分文字列は、そのガードレールに対して Log raw content がオンの場合にのみ記録されます（デフォルトはオフ — プライバシー保守的な姿勢、これがマルチテナントで最も重要です）。誤検出をマークしてチューニングします（Admin）。
Firewall → Events / Runs（Developer+） — すべてのツール呼び出しを、エージェント run ごとにロールアップ、つまり騒がしいテナントのループや新規の egress が際立ちます。
異常フィード（Member） — 学習された曜日内時間ベースラインに対してスコアリングされたレート／コストのスパイクが、各呼び出しが個別には許可される場合でも、パターン外で燃やしている 1 つのテナントを捕捉します。

ブロックされたリクエストは HTTP 400（guardrail_blocked / firewall_blocked）を返し、そのテナントのクォータを消費せず、skip-retry とマークされます — 境界はテナントに拒否を課金せずに保たれます。

8. さらに深く知るには

スコープキー、ポリシー、ワークスペース

キーアタッチメントとワークスペースデフォルトの完全な解決順序。

ガードレールリファレンス

すべてのルールタイプ、PII エンティティ、エンティティごとのオーバーライドを完全に。

ファイアウォールリファレンス

判定、サーフェス、自律性レベル、そしてポリシープレーン。

データ持ち出しを止める

テナントエージェントのアウトバウンド egress をロックダウンします。

​1. マルチテナント AI セキュリティモデル

キー漏洩 = 1 テナントの爆発半径

テナント間のデータ漏れ

騒がしいテナントエージェント

テナントごとのコンプライアンス

​2. ベースライン：すべてのテナントが継承する 1 つのワークスペースポリシー

​3. テナントごとに 1 つのスコープキー

​4. テナントごとのオーバーライド — 残りに触れずに 1 つを締める

​5. 具体的な 2 階層の例

​6. テナントごとのコンプライアンス & residency

​7. すべてのテナントを 1 つのワークスペースから監視する

​8. さらに深く知るには

スコープキー、ポリシー、ワークスペース

ガードレールリファレンス

ファイアウォールリファレンス

データ持ち出しを止める

1. マルチテナント AI セキュリティモデル

2. ベースライン：すべてのテナントが継承する 1 つのワークスペースポリシー

3. テナントごとに 1 つのスコープキー

4. テナントごとのオーバーライド — 残りに触れずに 1 つを締める

5. 具体的な 2 階層の例

6. テナントごとのコンプライアンス & residency

7. すべてのテナントを 1 つのワークスペースから監視する

8. さらに深く知るには