1. Zagrożenie denial of wallet AI
Incydent denial-of-wallet zwykle prowadzi do jednego z trzech kształtów:Rozbiegana pętla agenta
Rozbiegana pętla agenta
Agent ponawia to samo zawodzące narzędzie lub przeplanowuje w ciasnej
pętli, ponownie płacąc za tokeny przy każdym przejściu. Nie wymaga
złośliwości — zły warunek stopu wystarczy.
Wstrzyknięty rozkład
Wstrzyknięty rozkład
Prompt injection steruje agentem
ku spamowaniu narzędzia lub wystawianiu przerośniętych żądań, mnożąc
wydatki per tura.
Wyciekły lub nadmiernie szeroki klucz
Wyciekły lub nadmiernie szeroki klucz
Klucz ląduje gdzieś, gdzie nie powinien — zacommitowany
.env,
współdzielony notatnik — a atakujący uruchamia inferencję na twoim koncie,
aż wydatki zostaną zauważone.2. Sufit kosztu per uruchomienie z cap_cost
Werdykt cap_cost Firewalla to bezpiecznik dla rozbieganych pętli. Piszesz go
jako regułę z limitem w centach per uruchomienie; silnik sumuje zakumulowane
wydatki uruchomienia agenta i — gdy uruchomienie przekroczy limit — rozwiązuje
werdykt do deny — każde późniejsze wywołanie narzędzia w tym uruchomieniu
jest blokowane.
cap_cost to sufit przed-dyspozycją: ewaluuje, zanim wywołanie dotrze do
narzędzia, więc zatrzymuje następne drogie wywołanie zamiast zwracać już
wykonane. Typowy uniwersalny limit na każde narzędzie:
firewall_blocked — oznaczone jako skip-retry, więc pętla nie
może walić wokół odmowy. Sufit jest per uruchomienie agenta i sumowany w
całej polityce twojej przestrzeni roboczej, więc jedna rozbiegana konwersacja
nie może wkrwawić się w budżet innej.
Zobacz Referencję reguł firewalla dla pełnego
języka dopasowania i tego, gdzie cap_cost siedzi pośród innych werdyktów.
3. Twardy budżet per klucz z credit_limit_usd
cap_cost ogranicza pojedyncze uruchomienie. Aby ograniczyć klucz —
każde uruchomienie, które kiedykolwiek wystawi — ustaw credit_limit_usd na
kluczu API. To twardy sufit w USD na wydatki dożywotnie tego klucza: brama
konwertuje go na pozostałą kwotę klucza, a gdy klucz wyda swój przydział,
dalsze wywołania relay są odrzucane z powodu niewystarczającego kredytu. 0
oznacza nieograniczony.
Sparuj go z innymi zakresami klucza, aby wyciekły klucz był ograniczony na
każdej osi naraz:
credit_limit_usd
Twardy sufit wydatków w USD dla klucza (
0 = nieograniczony).expired_time
Znacznik czasu auto-wygaśnięcia (
-1 = nigdy). Krótkożyciowy klucz
ogranicza okno promienia rażenia.allow_ips
Przypnij klucz do znanych źródłowych IP — wyciekły klucz jest bezużyteczny
poza siecią.
model_limits
Ogranicz klucz do konkretnych modeli, aby nie mógł w ogóle sięgnąć
najdroższych.
credit_limit_usd,
którego nigdy nie powinien legalnie przekroczyć. Limit jest budżetem, nie
zgadywaniem zachowania atakującego — nawet w pełni skompromitowany klucz
zatrzymuje się na suficie.
Skonfiguruj to wszystko z edytora kluczy w konsoli (lub token API) pod swoją
sesją — to ustawienia klucza, nie wywołania relay. Tylko żądania inferencji
/v1/* używają samego klucza sk-orca-.... Edycja limitu wchodzi w życie
przy następnym żądaniu klucza; bez ponownego wdrożenia.4. Wychwyć skok, którego nie przewidziałeś: anomalie kosztu
Statyczny limit zatrzymuje wydatki, które przewidziałeś. Wykrywanie anomalii Firewalla wychwytuje wydatki, których nie. Uczy się normalnego kształtu użycia narzędzi każdej przestrzeni roboczej wobec bazowej linii godziny-tygodnia (14-dniowa średnia krocząca) i wypływa odchylenia na strumieniu czytelnym dla Membera:| Anomalia | Co flaguje |
|---|---|
burn_spike | Koszt narzędzia daleko ponad jego wyuczonym kosztem bazowym — sygnał denial-of-wallet. |
rate_spike | Wolumen wywołań daleko ponad bazową linią — rozkłady i powodzie. |
retry_loop | To samo narzędzie z tymi samymi argumentami powtarzające się w ciasnym oknie — klasyczna rozbiegana pętla. |
5. Składając to razem
Warstwuj te trzy, aby rozbiegana ścieżka nigdy nie dotarła do rachunku:| Kontrola | Zakres | Kiedy odpala |
|---|---|---|
Reguła cap_cost | Jedno uruchomienie agenta | Zakumulowane wydatki uruchomienia przekraczają limit w centach |
credit_limit_usd | Jeden klucz, dożywotnio | Całkowite wydatki klucza trafiają w jego sufit USD |
burn_spike / retry_loop | Przestrzeń robocza, wyuczone | Wydatki lub wzorzec powtórzeń odchyla się od bazowej linii |
cap_cost per uruchomienie na *, credit_limit_usd na
każdym kluczu agenta i nawyk sprawdzania strumienia anomalii. Wdróż nową
politykę cap_cost najpierw w trybie cienia
— loguje [shadow] would deny bez blokowania — abyś mógł zwymiarować limit
wobec prawdziwego ruchu, zanim zacznie kąsać.
6. Pokrewne zagrożenia
Denial of wallet rzadko przybywa sam — pętla, która pali twój budżet, jest często napędzana przez coś z góry:- Prompt injection — wstrzyknięte instrukcje są częstym wyzwalaczem rozkładu i spamu narzędzi.
- Nadmierna sprawczość — agent ze zbyt dużą swobodą ma więcej sposobów, by wydawać.
- Niebezpieczne wywołania narzędzi — ta sama płaszczyzna reguł firewalla ogranicza, co narzędzie może zrobić, nie tylko ile kosztuje.
- Model zagrożeń — gdzie rozbiegany koszt pasuje do pełnej agentowej powierzchni ataku.
Przegląd Firewalla
Werdykty, wykrywanie anomalii, poziomy autonomii i obserwowalność.
Klucze i polityki o ograniczonym zakresie
Jak limity kluczy, guardrails i polityki firewalla komponują się per
klucz.
