1. Dwa tryby
Każdy klucz rozwiązuje się dokładnie do jednego z dwóch stanów:Nieograniczony
unlimited_quota = true. Klucz czerpie z salda przestrzeni roboczej bez
pułapu per klucz. Żadne sprawdzenie wydatków nie odpala w czasie żądania
— jedynym limitem jest własne saldo przestrzeni roboczej.Ograniczony
credit_limit_usd > 0. Klucz niesie własny limit wydatków w całym okresie
życia w USD. Gdy skumulowane wydatki osiągną limit, klucz przestaje
działać — reszta przestrzeni roboczej jest nietknięta./console/token). Tworzenie
lub edycja klucza wymaga roli Developer lub wyższej.
credit_limit_usd = 0 oznacza nieograniczone — zero to wartownik dla
„brak limitu”, nie „limit zerowy-dolarowy”. By ograniczyć klucz, nadaj mu
dodatnią kwotę w dolarach.2. Jak kwota klucza api jest egzekwowana
Gdy ustawiszcredit_limit_usd na dodatnią liczbę, brama przelicza ją na
wewnętrzne saldo remain_quota dla tego klucza i przestawia
unlimited_quota na false. Od tej chwili:
remain_quotato pozostały zapas wydatków klucza, obniżany w miarę jak klucz rozlicza użycie.used_quotato skumulowane wydatki, które klucz już zaksięgował.- Przy każdym wywołaniu relay brama sprawdza klucz, zanim przekaże żądanie.
Ograniczony klucz, którego
remain_quotadoszło do zera, jest odrzucany jako wyczerpany — wywołanie nigdy nie dociera do modelu.
unlimited_quota = true) pomija to sprawdzenie salda
całkowicie; jest ograniczony tylko saldem przestrzeni roboczej i wszelkimi
innymi limitami na poziomie klucza, które ustawisz (lista dozwolonych modeli,
lista dozwolonych IP, wygaśnięcie).
3. Jeden konkretny przykład
Powiedzmy, że wdrażasz zaplanowanego agenta do streszczania i chcesz zagwarantować, że nigdy nie może wydać więcej niż $25, niezależnie od tego, co robi model. Ustaw limit, gdy tworzysz klucz:unlimited_quota = false i
remain_quota warte 25, klucz jest wyczerpany, a
każde dalsze wywołanie /v1/* jest odrzucane — bez patrzenia przez ciebie na
dashboard i bez dotykania reszty przestrzeni roboczej.
By później uczynić ten sam klucz nieograniczonym, edytuj go i przestaw
przełącznik nieograniczony — konsola ustawia unlimited_quota = true i
credit_limit_usd = 0 razem, a klucz może znów czerpać z pełnego salda
przestrzeni roboczej.
4. Który tryb wybrać
Klucze agentów / automatyzacji → ograniczone
Klucze agentów / automatyzacji → ograniczone
Każdy klucz wręczony autonomicznemu agentowi, zadaniu CI lub integracji
osoby trzeciej powinien być ograniczony. Limit wydatków to najtańsza
gwarancja, że pętla prompt-injection lub burza ponowień nie nabije
nieograniczonego rachunku — limit zatrzymuje klucz, zanim szkoda się
skumuluje. Połącz go z ciasnym
limitem modeli i
listą dozwolonych IP.
Klucze krótkożyciowe / eksperymentalne → ograniczone + wygaśnięcie
Klucze krótkożyciowe / eksperymentalne → ograniczone + wygaśnięcie
Dla klucza, który istnieje tylko na demo, test obciążeniowy lub
pojedyncze wdrożenie, połącz mały
credit_limit_usd z expired_time.
Klucz sam się wycofuje na tym limicie, który zadziała pierwszy. Zobacz
Kwota, limit i wygaśnięcie oraz
Klucze wygasające.Zaufane wewnętrzne / wysokowolumenowe klucze → nieograniczone
Zaufane wewnętrzne / wysokowolumenowe klucze → nieograniczone
Klucz używany przez kluczową usługę produkcyjną, którą w pełni
kontrolujesz, gdzie limit per klucz powodowałby tylko fałszywe awarie,
może pozostać nieograniczony — saldo przestrzeni roboczej jest
zabezpieczeniem. Trzymaj takich kluczy mało, nazywaj je jasno i wciąż
ograniczaj je limitami modeli i IP.
5. Jak pola limitu się odnoszą
Trzy pola, które tym rządzą, to pojedynczy przełącznik z wyprowadzonym saldem — ustawiasz limit w dolarach, brama wyprowadza resztę:| Pole | Znaczenie |
|---|---|
credit_limit_usd | Twoje wejście. > 0 = ograniczony limit w USD; 0 = nieograniczone. |
unlimited_quota | true, gdy klucz nie ma limitu; ustawiane na false automatycznie, gdy nadasz dodatni credit_limit_usd. |
remain_quota | Wyprowadzony zapas wydatków dla ograniczonego klucza; dojście do zera wyczerpuje klucz. |
credit_limit_usd (lub unlimited_quota) w edytorze.
remain_quota i used_quota są utrzymywane przez bramę w miarę jak klucz
rozlicza użycie — to telemetria tylko do odczytu, wyświetlana w widokach
użycia konsoli.
6. Gdzie to siedzi w stosie kontrolnym
Limit wydatków ogranicza, ile klucz może zrobić; reszta zakresu klucza ogranicza, co może zrobić. Oba się komponują:Kwota, limit i wygaśnięcie
Połącz limit w dolarach z bezwzględnym wygaśnięciem, tak by klucz sam się
wycofał na tym limicie, który zadziała pierwszy.
Obiekt tokenu
Każde pole, które niesie klucz — limity modeli, lista dozwolonych IP,
załączniki polityk, etykieta środowiska — w jednej referencji.
Lista kontrolna minimalnych uprawnień
Pełny przepis na najwęższy możliwy klucz, jedno ograniczenie naraz.
Zakres, klucze i polityki
Jak limit pasuje do hierarchii przestrzeń robocza → polityka → klucz i
jak ograniczenie klucza zmniejsza promień rażenia.
