Przejdź do głównej treści
Klucz bez pułapu to klucz, który może wydrenować całe saldo twojej przestrzeni roboczej, jeśli agent wpadnie w pętlę. Najskuteczniejszym pojedynczym sposobem ograniczenia promienia rażenia skompromitowanego lub rozbieganego agenta jest nadanie jego kluczowi limitu wydatków. Na hostowanej bramie każdy klucz jest albo nieograniczony, albo ograniczony kwotą klucza api mierzoną w dolarach amerykańskich — a wybór to jedno pole w edytorze klucza. Ta strona wyjaśnia dwa tryby, jak limit jest egzekwowany na ścieżce relay i kiedy który wybrać. Po pełny zestaw ograniczeń, które niesie klucz — listy dozwolonych modeli, listy dozwolonych IP, załączniki polityk — zobacz Obiekt tokenu.

1. Dwa tryby

Każdy klucz rozwiązuje się dokładnie do jednego z dwóch stanów:

Nieograniczony

unlimited_quota = true. Klucz czerpie z salda przestrzeni roboczej bez pułapu per klucz. Żadne sprawdzenie wydatków nie odpala w czasie żądania — jedynym limitem jest własne saldo przestrzeni roboczej.

Ograniczony

credit_limit_usd > 0. Klucz niesie własny limit wydatków w całym okresie życia w USD. Gdy skumulowane wydatki osiągną limit, klucz przestaje działać — reszta przestrzeni roboczej jest nietknięta.
Ustawiasz to na ekranie Klucze w konsoli (/console/token). Tworzenie lub edycja klucza wymaga roli Developer lub wyższej.
credit_limit_usd = 0 oznacza nieograniczone — zero to wartownik dla „brak limitu”, nie „limit zerowy-dolarowy”. By ograniczyć klucz, nadaj mu dodatnią kwotę w dolarach.

2. Jak kwota klucza api jest egzekwowana

Gdy ustawisz credit_limit_usd na dodatnią liczbę, brama przelicza ją na wewnętrzne saldo remain_quota dla tego klucza i przestawia unlimited_quota na false. Od tej chwili:
  • remain_quota to pozostały zapas wydatków klucza, obniżany w miarę jak klucz rozlicza użycie.
  • used_quota to skumulowane wydatki, które klucz już zaksięgował.
  • Przy każdym wywołaniu relay brama sprawdza klucz, zanim przekaże żądanie. Ograniczony klucz, którego remain_quota doszło do zera, jest odrzucany jako wyczerpany — wywołanie nigdy nie dociera do modelu.
Nieograniczony klucz (unlimited_quota = true) pomija to sprawdzenie salda całkowicie; jest ograniczony tylko saldem przestrzeni roboczej i wszelkimi innymi limitami na poziomie klucza, które ustawisz (lista dozwolonych modeli, lista dozwolonych IP, wygaśnięcie).
Ograniczony klucz to limit w całym okresie życia, nie kroczący miesięczny budżet — limit liczy łączne wydatki przez całe życie klucza. Po budżet, który się resetuje, wydaj świeży ograniczony klucz we własnym rytmie (np. nowy klucz na sprint) i unieważnij stary. Zobacz Zarządzanie kluczami.

3. Jeden konkretny przykład

Powiedzmy, że wdrażasz zaplanowanego agenta do streszczania i chcesz zagwarantować, że nigdy nie może wydać więcej niż $25, niezależnie od tego, co robi model. Ustaw limit, gdy tworzysz klucz:
// POST na ekran Klucze w konsoli (Developer+).
// Konfiguruj w konsoli — klucz relay (sk-orca-…) nigdy nie jest używany do
// administrowania kluczami; jest okazywany tylko przy wywołaniach inferencji /v1/*.
{
  "name": "nightly-summarizer",
  "credit_limit_usd": 25,        // ograniczony: limit $25 w całym okresie życia
  "model_limits_enabled": true,
  "model_limits": ["openai/gpt-4o-mini"],
  "expired_time": -1             // -1 = nigdy nie wygasa
}
Brama przechowuje to jako klucz ograniczony: unlimited_quota = false i remain_quota warte 25.Agentwywołujemodelkluczemrelayskorcajakzwykle.Wchwili,gdyskumulowanewydatkisięgną25. Agent wywołuje model kluczem relay `sk-orca-…` jak zwykle. W chwili, gdy skumulowane wydatki sięgną 25, klucz jest wyczerpany, a każde dalsze wywołanie /v1/* jest odrzucane — bez patrzenia przez ciebie na dashboard i bez dotykania reszty przestrzeni roboczej. By później uczynić ten sam klucz nieograniczonym, edytuj go i przestaw przełącznik nieograniczony — konsola ustawia unlimited_quota = true i credit_limit_usd = 0 razem, a klucz może znów czerpać z pełnego salda przestrzeni roboczej.

4. Który tryb wybrać

Każdy klucz wręczony autonomicznemu agentowi, zadaniu CI lub integracji osoby trzeciej powinien być ograniczony. Limit wydatków to najtańsza gwarancja, że pętla prompt-injection lub burza ponowień nie nabije nieograniczonego rachunku — limit zatrzymuje klucz, zanim szkoda się skumuluje. Połącz go z ciasnym limitem modeli i listą dozwolonych IP.
Dla klucza, który istnieje tylko na demo, test obciążeniowy lub pojedyncze wdrożenie, połącz mały credit_limit_usd z expired_time. Klucz sam się wycofuje na tym limicie, który zadziała pierwszy. Zobacz Kwota, limit i wygaśnięcie oraz Klucze wygasające.
Klucz używany przez kluczową usługę produkcyjną, którą w pełni kontrolujesz, gdzie limit per klucz powodowałby tylko fałszywe awarie, może pozostać nieograniczony — saldo przestrzeni roboczej jest zabezpieczeniem. Trzymaj takich kluczy mało, nazywaj je jasno i wciąż ograniczaj je limitami modeli i IP.
Ograniczony klucz, który wyczerpuje się w połowie przebiegu, zaczyna odrzucać wywołania natychmiast. O to chodzi — ale to znaczy, że nienadzorowany agent może zatrzymać się w połowie zadania. Dobierz rozmiar limitu do pracy, której oczekujesz, i obserwuj wydatki w widokach użycia konsoli, byś mógł podnieść limit, zanim ugryzie prawowity przebieg.

5. Jak pola limitu się odnoszą

Trzy pola, które tym rządzą, to pojedynczy przełącznik z wyprowadzonym saldem — ustawiasz limit w dolarach, brama wyprowadza resztę:
PoleZnaczenie
credit_limit_usdTwoje wejście. > 0 = ograniczony limit w USD; 0 = nieograniczone.
unlimited_quotatrue, gdy klucz nie ma limitu; ustawiane na false automatycznie, gdy nadasz dodatni credit_limit_usd.
remain_quotaWyprowadzony zapas wydatków dla ograniczonego klucza; dojście do zera wyczerpuje klucz.
Ustawiasz tylko credit_limit_usd (lub unlimited_quota) w edytorze. remain_quota i used_quota są utrzymywane przez bramę w miarę jak klucz rozlicza użycie — to telemetria tylko do odczytu, wyświetlana w widokach użycia konsoli.

6. Gdzie to siedzi w stosie kontrolnym

Limit wydatków ogranicza, ile klucz może zrobić; reszta zakresu klucza ogranicza, co może zrobić. Oba się komponują:

Kwota, limit i wygaśnięcie

Połącz limit w dolarach z bezwzględnym wygaśnięciem, tak by klucz sam się wycofał na tym limicie, który zadziała pierwszy.

Obiekt tokenu

Każde pole, które niesie klucz — limity modeli, lista dozwolonych IP, załączniki polityk, etykieta środowiska — w jednej referencji.

Lista kontrolna minimalnych uprawnień

Pełny przepis na najwęższy możliwy klucz, jedno ograniczenie naraz.

Zakres, klucze i polityki

Jak limit pasuje do hierarchii przestrzeń robocza → polityka → klucz i jak ograniczenie klucza zmniejsza promień rażenia.
Im węższy limit wydatków każdego klucza, tym mniejszy rachunek, jaki może nabić którykolwiek skompromitowany agent — i tym jaśniejszy twój ślad audytu tego, ile każdy klucz był upoważniony wydać.