gpt-4o-mini na
najdroższy model, do jakiego masz dostęp, lub na taki, którego obchodzenie
się z danymi nigdy nie zatwierdziłeś.
Rozwiązaniem jest lista dozwolonych modeli per klucz. Każdy klucz niesie
pole model_limits (bramkowane przez model_limits_enabled). Gdy jest
włączone, żądanie dowolnego modelu spoza listy jest odrzucane w bramie —
zanim zostanie wybrany kanał i zanim cokolwiek ruszy do dostawcy.
To jedno ograniczenie na obiekcie klucza.
Komponuje się z listą dozwolonych IP klucza, limitem wydatków, wygaśnięciem i
dołączoną polityką guardrail / firewall — każde zawęża klucz niezależnie.
1. Po co ograniczać dostęp do modeli per klucz API
Wybór modelu to dźwignia uprawnień. Klucz, który może wywołać dowolny model, może zostać skierowany ku:- Wybuchom kosztów — przełączenie na model premium zwielokrotnia rachunek za token.
- Pełzaniu możliwości — zadanie ograniczone do małego modelu zostaje poprowadzone do modelu z pierwszej linii, który może o wiele więcej, niż zamierzałeś.
- Dryfowi zgodności — wysyłaniu ruchu do rodziny modeli, której nie zatwierdziłeś dla danej klasy danych.
2. Dwa pola
Limity modeli żyją na kluczu jako para:| Pole | Typ | Znaczenie |
|---|---|---|
model_limits_enabled | bool | Główny przełącznik. Gdy false, klucz sięga do każdego modelu, na który pozwala przestrzeń robocza. |
model_limits | lista | Lista dozwolonych nazw modeli. Ma znaczenie tylko, gdy model_limits_enabled jest true. |
3. Ustaw to na kluczu
Skonfiguruj limity modeli w edytorze klucza w konsoli (/console/token),
w tym samym miejscu, w którym ustawiasz inne ograniczenia klucza. Tworzenie
lub edycja klucza wymaga roli Developer lub wyższej.
- Otwórz klucz (lub Utwórz klucz).
- Włącz Limity modeli.
- Wybierz modele, które ten klucz może wywoływać — pisz, by filtrować dostępne modele przestrzeni roboczej.
- Zapisz. Zmiana wchodzi w życie przy następnym żądaniu klucza — bez ponownego wdrożenia, bez rotacji klucza.
gpt-4o-mini. Każda inna nazwa
modelu w żądaniu od tego klucza jest odrzucana — nie ma fallbacku do
domyślnego modelu ani cichego obniżenia.
4. Jak wygląda odrzucone żądanie
Gdymodel_limits_enabled jest włączone, a żądanie nazywa model spoza listy,
brama przerywa żądanie z HTTP 403 i ciałem błędu w kształcie OpenAI:
Dzieje się przed wyborem dostawcy
Dzieje się przed wyborem dostawcy
Sprawdzenie odbywa się, gdy brama wciąż wybiera kanał — żądanie nigdy nie
dociera do dostawcy nadrzędnego, więc zabroniony model nie kosztuje
tokenów modelu.
Pusta lista = brak modeli
Pusta lista = brak modeli
Przy włączonym przełączniku i pustej liście dozwolonych komunikat to
“This token has no access to any models”, a każde żądanie jest
odrzucane. To różnica między „ogranicz do listy” a „zablokuj klucz przed
inferencją całkowicie”.
Dopasowanie jest na kanonicznej nazwie modelu
Dopasowanie jest na kanonicznej nazwie modelu
Nazwa modelu z żądania jest normalizowana, zanim lista zostanie
sprawdzona, więc powiązane warianty (np. warianty thinking) rozwiązują
się do tej samej kanonicznej nazwy, którą umieściłeś na liście
dozwolonych. Wypisz bazową nazwę modelu, którą pokazuje konsola.
5. Limity modeli vs uprawnienia grupowe
Dwie różne rzeczy decydują, czy klucz może wywołać model. Nie myl ich:| Warstwa | Zakres | Pytanie, na które odpowiada |
|---|---|---|
| Uprawnienie przestrzeni roboczej | Przestrzeń robocza | Czy ten model jest w ogóle dostępny dla przestrzeni roboczej? |
model_limits | Pojedynczy klucz | Z dostępnych modeli, których może użyć TEN klucz? |
model_limits zawsze tylko zawęża. Klucz nie może użyć limitów modeli,
by sięgnąć do modelu, do którego sama przestrzeń robocza nie jest uprawniona
— może jedynie wykroić mniejszą listę dozwolonych z tego, co już jest
dozwolone. By nadać kluczowi nic ekstra, ale ściśle mniej, dokładnie do
tego służy to pole.
6. Gdzie to pasuje do postawy minimalnych uprawnień
Limity modeli to jedna linia przepisu na klucz per agent. Najwęższy użyteczny klucz dla autonomicznego agenta przypina wszystkie jego osie naraz:model_limits— jeden lub dwa modele, których agent potrzebuje (ta strona).allow_ips— zakres egressu agenta, zobacz Listę dozwolonych IP.credit_limit_usd— pułap wydatków, zobacz Kwotę, limit i wygaśnięcie.expired_time— automatyczne wygaśnięcie, zobacz Klucze wygasające.guardrail_id/firewall_policy_id— polityka treści i wywołań narzędzi, zobacz Powiązanie polityk z kluczem.
Limity modeli to ograniczenie tożsamości na kluczu, nie polityka treści
ani akcji. Nie sprawdzają promptów (to robią
Guardrails) ani wywołań narzędzi (to robi
Firewall) — decydują z góry, do którego modelu klucz
w ogóle wolno zaadresować.
7. Kolejne kroki
Obiekt klucza
Każde pole, które niesie klucz — limity modeli, lista IP, limity,
wygaśnięcie i załączniki polityk — w jednej referencji.
Lista kontrolna minimalnych uprawnień
Pełny przepis na klucz per agent: ogranicz każdą oś do minimum, którego
agent potrzebuje.
Zakres, klucze i polityki
Jak klucze, guardrails i polityki firewalla wiążą się w jedną tożsamość
agenta.
Powiązanie polityk z kluczem
Dołącz guardrail i politykę firewalla do tego samego klucza.
