gpt-4o-mini から、
あなたがアクセスできる最も高価なモデル、あるいはデータ取り扱いを一度も承認していない
モデルへ、ひそかに切り替えられます。
修正策は、キーごとのモデル許可リストです。各キーは model_limits フィールド
(model_limits_enabled でゲート)を運びます。それがオンのとき、リストにないモデルへの
リクエストはゲートウェイで拒否されます — チャネルが選択される前、そして何かがプロバイダへ
向けて離れる前です。
これはキーオブジェクト上の 1 つの制約です。キーの IP
許可リスト、支出上限、失効、そしてアタッチされたガードレール / ファイアウォールポリシーと
組み合わさり — それぞれが独立してキーを狭めます。
1. なぜ API キーごとにモデルアクセスを制限するのか
モデル選択は権限のレバーです。任意のモデルを呼べるキーは、次へと誘導され得ます:- コスト爆発 — プレミアムモデルへの切り替えはトークンあたりの請求を倍増させます。
- 能力クリープ — 小さなモデル向けにスコープされたタスクが、意図したよりはるかに 多くをこなせるフロンティアモデルにルーティングされます。
- コンプライアンスドリフト — 特定のデータクラスについて承認していないモデルファミリに トラフィックを送る。
2. 2 つのフィールド
モデル制限はペアでキー上に存在します:| フィールド | 型 | 意味 |
|---|---|---|
model_limits_enabled | bool | マスタースイッチ。false のとき、キーはワークスペースが許可するすべてのモデルに到達します。 |
model_limits | list | モデル名の許可リスト。model_limits_enabled が true のときのみ意味を持ちます。 |
3. キーに設定する
モデル制限は、キーの他の制約を設定するのと同じ場所、コンソールのキーエディタ (/console/token)で設定します。キーの作成または編集には Developer ロール以上が
必要です。
- キーを開く(または Create key)。
- Model limits を有効化する。
- このキーが呼んでよいモデルを選ぶ — 入力してワークスペースの利用可能なモデルを フィルタします。
- 保存。変更はキーの次のリクエストで反映されます — 再デプロイなし、キー ローテーションなし。
gpt-4o-mini に固定されます。このキーからのリクエスト上の他のどの
モデル名も拒否されます — デフォルトモデルへのフォールバックもサイレントなダウングレードも
ありません。
4. 拒否されたリクエストがどう見えるか
model_limits_enabled がオンで、リクエストがリスト外のモデルを名指しすると、ゲートウェイは
HTTP 403 と OpenAI 形式のエラーボディでリクエストを中断します:
プロバイダ選択の前に発生する
プロバイダ選択の前に発生する
チェックはゲートウェイがまだチャネルを選んでいる間に実行されます — リクエストは
アップストリームのプロバイダに決して到達しないため、禁止されたモデルはモデルトークンを
消費しません。
空のリスト = モデルなし
空のリスト = モデルなし
スイッチがオンで空の許可リストの場合、メッセージは “This token has no access to any
models” となり、すべてのリクエストが拒否されます。これが「リストに制限する」と
「キーを推論から完全に締め出す」の違いです。
マッチングは正規化されたモデル名で行われる
マッチングは正規化されたモデル名で行われる
リクエストのモデル名はリストがチェックされる前に正規化されるため、関連するバリアント
(例:thinking バリアント)は、あなたが許可リスト化したのと同じ正規名に解決されます。
コンソールが表示するベースモデル名をリストしてください。
5. モデル制限 vs グループ権利
キーがモデルを呼べるかどうかを決めるのは、2 つの異なるものです。混同しないでください:| 層 | スコープ | それが答える問い |
|---|---|---|
| ワークスペース権利 | ワークスペース | このモデルはそもそもワークスペースに利用可能か? |
model_limits | 単一のキー | 利用可能なモデルのうち、この キーはどれを使ってよいか? |
model_limits は常に狭めるだけです。キーはモデル制限を使って、ワークスペース自体が
権利を持たないモデルに到達することはできません — すでに許可されているものから、より小さな
許可リストを切り出せるだけです。キーに何も追加せず、厳密により少なく与えるには、それが
まさにこのフィールドの用途です。
6. 最小権限姿勢へのフィット
モデル制限は、エージェントごとのキーレシピの 1 行です。自律エージェント向けの最も狭い 有用なキーは、そのすべての軸を一度に固定します:model_limits— エージェントが必要とする 1 つか 2 つのモデル(このページ)。allow_ips— エージェントの egress レンジ、 IP 許可リストを参照。credit_limit_usd— 支出上限、 クォータ上限と失効を参照。expired_time— 自動失効、失効するキーを参照。guardrail_id/firewall_policy_id— コンテンツとツール呼び出しポリシー、 キーにポリシーをバインドを参照。
7. 次のステップ
キーオブジェクト
キーが運ぶすべてのフィールド — モデル制限、IP リスト、上限、失効、ポリシー
アタッチメント — を 1 つのリファレンスに。
最小権限チェックリスト
エージェントごとの完全なキーレシピ:すべての軸をエージェントが必要とする最小に
スコープします。
スコープ、キー、ポリシー
キー、ガードレール、ファイアウォールポリシーがどのように 1 つのエージェント
アイデンティティへとバインドされるか。
キーにポリシーをバインド
ガードレールとファイアウォールポリシーを同じキーにアタッチします。
