キーを特定のモデルに制限する

1 つの API キーは、あなたのワークスペースが権利を持つすべてのモデルに到達できます。それはコンソールセッションには便利ですが、長命のエージェントには危険です：プロンプトインジェクションされたエージェントが無制限のキーを持っていると、gpt-4o-mini から、あなたがアクセスできる最も高価なモデル、あるいはデータ取り扱いを一度も承認していないモデルへ、ひそかに切り替えられます。修正策は、キーごとのモデル許可リストです。各キーは model_limits フィールド（model_limits_enabled でゲート）を運びます。それがオンのとき、リストにないモデルへのリクエストはゲートウェイで拒否されます — チャネルが選択される前、そして何かがプロバイダへ向けて離れる前です。

これはキーオブジェクト上の 1 つの制約です。キーの IP 許可リスト、支出上限、失効、そしてアタッチされたガードレール / ファイアウォールポリシーと組み合わさり — それぞれが独立してキーを狭めます。

1. なぜ API キーごとにモデルアクセスを制限するのか

モデル選択は権限のレバーです。任意のモデルを呼べるキーは、次へと誘導され得ます：

コスト爆発 — プレミアムモデルへの切り替えはトークンあたりの請求を倍増させます。
能力クリープ — 小さなモデル向けにスコープされたタスクが、意図したよりはるかに多くをこなせるフロンティアモデルにルーティングされます。
コンプライアンスドリフト — 特定のデータクラスについて承認していないモデルファミリにトラフィックを送る。

キーをエージェントが実際に必要とする 1 つか 2 つのモデルに制限することで、3 つすべてを一度に塞ぎます。それは、ツールを許可リスト化するファイアウォールのモデル軸版です — エージェントはあなたが名指ししたものにしか到達できず、それ以外には何も到達できません。

2. 2 つのフィールド

モデル制限はペアでキー上に存在します：

フィールド	型	意味
`model_limits_enabled`	bool	マスタースイッチ。`false` のとき、キーはワークスペースが許可するすべてのモデルに到達します。
`model_limits`	list	モデル名の許可リスト。`model_limits_enabled` が `true` のときのみ意味を持ちます。

2 つのフィールドは独立しており、その組み合わせが重要です：model_limits_enabled = true で空のリストは、キーがいかなるモデルにも到達できないことを意味します — すべてのリクエストが “This token has no access to any models.” で拒否されます。少なくとも 1 つのモデルを名指ししてから、初めてスイッチをオンにしてください。

3. キーに設定する

モデル制限は、キーの他の制約を設定するのと同じ場所、コンソールのキーエディタ（/console/token）で設定します。キーの作成または編集には Developer ロール以上が必要です。

キーを開く（または Create key）。
Model limits を有効化する。
このキーが呼んでよいモデルを選ぶ — 入力してワークスペースの利用可能なモデルをフィルタします。
保存。変更はキーの次のリクエストで反映されます — 再デプロイなし、キーローテーションなし。

1 つの安価なモデルにしか触れるべきでないスケジュール要約器は、ちょうど 1 エントリの許可リストに行き着きます：

model_limits_enabled: true
model_limits:         ["openai/gpt-4o-mini"]

その時点から、キーは gpt-4o-mini に固定されます。このキーからのリクエスト上の他のどのモデル名も拒否されます — デフォルトモデルへのフォールバックもサイレントなダウングレードもありません。

モデル制限を、同じキー上の credit_limit_usd 上限とペアにしてください。モデルリストは暴走ループがどのモデルに到達できるかを境界づけ；支出上限はキーが動作を停止する前に どれだけ燃やせるかを境界づけます。2 つの独立した上限、どちらもゲートウェイで強制されます。クォータ上限と失効を参照。

4. 拒否されたリクエストがどう見えるか

model_limits_enabled がオンで、リクエストがリスト外のモデルを名指しすると、ゲートウェイは HTTP 403 と OpenAI 形式のエラーボディでリクエストを中断します：

{
  "error": {
    "message": "This token has no access to model claude-opus-4-8 (request id: 2024...abc)",
    "type": "orcarouter_api_error",
    "code": ""
  }
}

この拒否の主要な特性：

プロバイダ選択の前に発生する

チェックはゲートウェイがまだチャネルを選んでいる間に実行されます — リクエストはアップストリームのプロバイダに決して到達しないため、禁止されたモデルはモデルトークンを消費しません。

空のリスト = モデルなし

スイッチがオンで空の許可リストの場合、メッセージは “This token has no access to any models” となり、すべてのリクエストが拒否されます。これが「リストに制限する」と「キーを推論から完全に締め出す」の違いです。

マッチングは正規化されたモデル名で行われる

リクエストのモデル名はリストがチェックされる前に正規化されるため、関連するバリアント（例：thinking バリアント）は、あなたが許可リスト化したのと同じ正規名に解決されます。コンソールが表示するベースモデル名をリストしてください。

5. モデル制限 vs グループ権利

キーがモデルを呼べるかどうかを決めるのは、2 つの異なるものです。混同しないでください：

層	スコープ	それが答える問い
ワークスペース権利	ワークスペース	このモデルはそもそもワークスペースに利用可能か？
`model_limits`	単一のキー	利用可能なモデルのうち、このキーはどれを使ってよいか？

model_limits は常に狭めるだけです。キーはモデル制限を使って、ワークスペース自体が権利を持たないモデルに到達することはできません — すでに許可されているものから、より小さな許可リストを切り出せるだけです。キーに何も追加せず、厳密により少なく与えるには、それがまさにこのフィールドの用途です。

6. 最小権限姿勢へのフィット

モデル制限は、エージェントごとのキーレシピの 1 行です。自律エージェント向けの最も狭い有用なキーは、そのすべての軸を一度に固定します：

model_limits — エージェントが必要とする 1 つか 2 つのモデル（このページ）。
allow_ips — エージェントの egress レンジ、 IP 許可リストを参照。
credit_limit_usd — 支出上限、クォータ上限と失効を参照。
expired_time — 自動失効、失効するキーを参照。
guardrail_id / firewall_policy_id — コンテンツとツール呼び出しポリシー、キーにポリシーをバインドを参照。

そのようなキーがプロンプトインジェクションで侵害されたとき、被害範囲はすべての軸で境界づけられます — 攻撃者があなたの予算を費やせるモデルを含めて。

モデル制限はキー上のアイデンティティ制約であり、コンテンツやアクションのポリシーではありません。プロンプトを検査することも（それはガードレール）、ツール呼び出しを検査することも（それはファイアウォール）ありません — それらは前もって、キーがそもそもどのモデルに宛ててよいかを決定します。

7. 次のステップ

キーオブジェクト

キーが運ぶすべてのフィールド — モデル制限、IP リスト、上限、失効、ポリシーアタッチメント — を 1 つのリファレンスに。

最小権限チェックリスト

エージェントごとの完全なキーレシピ：すべての軸をエージェントが必要とする最小にスコープします。

スコープ、キー、ポリシー

キー、ガードレール、ファイアウォールポリシーがどのように 1 つのエージェントアイデンティティへとバインドされるか。

キーにポリシーをバインド

ガードレールとファイアウォールポリシーを同じキーにアタッチします。

API キーごとにモデルアクセスを制限することは、適用できる最も安価な権限コントロールです： 1 つの許可リスト、ゲートウェイで強制され、どんな侵害されたエージェントも口先で回避できません。

​1. なぜ API キーごとにモデルアクセスを制限するのか

​2. 2 つのフィールド

​3. キーに設定する

​4. 拒否されたリクエストがどう見えるか

​5. モデル制限 vs グループ権利

​6. 最小権限姿勢へのフィット

​7. 次のステップ

キーオブジェクト

最小権限チェックリスト

スコープ、キー、ポリシー

キーにポリシーをバインド

1. なぜ API キーごとにモデルアクセスを制限するのか

2. 2 つのフィールド

3. キーに設定する

4. 拒否されたリクエストがどう見えるか

5. モデル制限 vs グループ権利

6. 最小権限姿勢へのフィット

7. 次のステップ