1. Limit wydatków klucza api: credit_limit_usd
credit_limit_usd to pułap wydatków w całym okresie życia klucza, wyrażony w
zwykłych USD. Wpisujesz kwotę w dolarach w edytorze klucza; OrcaRouter
przelicza ją na początkową kwotę klucza i mierzy każde wywołanie wobec niej.
Ograniczone
credit_limit_usd: 25 wybija klucz z $25 wydatków. Każde wywołanie
obciąża swoim kosztem; gdy pozostałe saldo dojdzie do zera, klucz
przestaje autoryzować, a każde dalsze żądanie jest odrzucane.Nieograniczone
credit_limit_usd: 0 to wartownik dla braku limitu — klucz czerpie
z salda twojej przestrzeni roboczej bez pułapu per klucz. Wygodne, ale
najgorszy promień rażenia, gdy wycieknie.2. Jak limit jest mierzony: remain_quota i used_quota
Limit w dolarach, który wpisujesz, to powierzchnia widoczna dla człowieka.
Pod nią brama śledzi dwa bieżące liczniki na kluczu:
| Pole | Znaczenie |
|---|---|
remain_quota | Wydatki pozostałe, zanim klucz przestanie autoryzować. |
used_quota | Wydatki zużyte dotąd przez okres życia klucza. |
credit_limit_usd zasiewa remain_quota z tej kwoty w
dolarach; każde rozliczone wywołanie przesuwa koszt z remain_quota do
used_quota. Klucz z nieograniczonym limitem niesie zamiast tego
unlimited_quota, a sprawdzenie salda jest pomijane całkowicie.
Block guardrailu lub firewalla nic nie kosztuje wobec limitu, gdy odpala,
zanim model się uruchomi —
guardrail_blocked na etapie wejścia i
firewall_blocked inbound oba dzieją się przed pomiarem, więc remain_quota
jest nietknięte. Block guardrailu na etapie wyjścia zwraca koszt żądania.
Zobacz guardrails i
firewall.3. Auto-wygaśnięcie: expired_time
expired_time to bezwzględny punkt odcięcia — uniksowy znacznik czasu epoki
(sekundy), po którym klucz przestaje autoryzować, bez względu na to, ile
budżetu zostaje.
- Przyszły znacznik czasu wygasza klucz w tym momencie. Brama porównuje go z aktualnym czasem przy każdym żądaniu i odrzuca wywołanie, gdy minie.
-1to wartownik dla nigdy nie wygasa.
4. Jeden konkretny ograniczony, wygasający klucz
Nocne zadanie, które uzgadnia faktury jednym tanim modelem, działa przez dwutygodniowy pilotaż i nigdy nie powinno kosztować więcej niż kilka dolarów na noc, potrzebuje prawie żadnych uprawnień. Skonfiguruj jego klucz w edytorze klucza w konsoli (/console/token — Developer+):
Ustaw limit wydatków
credit_limit_usd: 40 — cały budżet pilotażu. Rozbiegana pętla
ponawiania wyczerpuje klucz, nie saldo twojej przestrzeni roboczej.Ustaw wygaśnięcie
expired_time: uniksowy znacznik czasu końca okna pilotażu. Klucz
auto-wygasa i nie może być ponownie użyty po zakończeniu pilotażu.Oba pola to USD-i-czas na kluczu, nie polityka obejmująca całą przestrzeń
roboczą. By ograniczyć wydatki pojedynczego przebiegu agenta (a nie życia
klucza), werdykt
cap_cost Firewalla to bezpiecznik per przebieg — zobacz
reguły firewalla. Oba się komponują: limit
klucza ogranicza okres życia, cap_cost ogranicza pojedynczy przebieg.5. Kto może to ustawić
Ustawieniecredit_limit_usd i expired_time jest częścią tworzenia lub
edycji klucza, co wymaga roli Developer lub wyższej. Każdy członek
przestrzeni roboczej może odczytać zamaskowany rekord klucza; tylko
Developer+ może zmienić jego limity. Klucze są maskowane przy wyświetlaniu —
plaintext jest pokazywany raz przy tworzeniu (zobacz
maskowanie klucza).
6. Ograniczony domyślnie
Klucz zcredit_limit_usd: 0 i expired_time: -1 nie ma limitu
wydatków i nigdy nie wygasa — maksymalne uprawnienia, najgorszy promień
rażenia. Uczyń to świadomym wyjątkiem, nie domyślnym.
Nieograniczone vs ograniczone
Kiedy klucz bez limitu i niewygasający to faktycznie właściwy wybór — a
kiedy nie.
Lista kontrolna minimalnych uprawnień
Przepuść każdy produkcyjny klucz przez ten sam przebieg utwardzania,
zanim trafi na produkcję.
7. Powiązane
Obiekt tokenu
Każde pole na kluczu, w tym liczniki kwoty.
Powiązanie polityk
Dołącz guardrail i politykę firewalla do tego samego klucza.
Nadmierne uprawnienia
Zagrożenie, które limity wydatków i wygaśnięcie mają zawężać.
