1. Die zwei Modi
Jeder Schlüssel löst auf genau einen von zwei Zuständen auf:Unbegrenzt
unlimited_quota = true. Der Schlüssel zieht auf das Workspace-Guthaben
ohne Pro-Schlüssel-Obergrenze. Zur Request-Zeit läuft keine
Ausgabenprüfung — das einzige Limit ist das eigene Guthaben des
Workspaces.Begrenzt
credit_limit_usd > 0. Der Schlüssel trägt sein eigenes
Lebenszeit-Ausgabenlimit in USD. Sobald die kumulierten Ausgaben das Cap
erreichen, hört der Schlüssel auf zu funktionieren — der Rest des
Workspaces bleibt unberührt./console/token). Das
Erstellen oder Bearbeiten eines Schlüssels erfordert die Rolle Developer
oder höher.
credit_limit_usd = 0 bedeutet unbegrenzt — null ist der Sentinel für
„kein Cap”, nicht „ein Null-Dollar-Cap”. Um einen Schlüssel zu begrenzen,
geben Sie ihm einen positiven Dollarbetrag.2. Wie ein API-Key-Kontingent durchgesetzt wird
Wenn Siecredit_limit_usd auf eine positive Zahl setzen, wandelt das Gateway
es in einen internen remain_quota-Saldo für diesen Schlüssel um und
schaltet unlimited_quota auf false. Von da an:
remain_quotaist der verbleibende Ausgabenspielraum des Schlüssels, abgebaut, während der Schlüssel Nutzung abrechnet.used_quotasind die kumulierten Ausgaben, die der Schlüssel bereits gebucht hat.- Bei jedem Relay-Aufruf prüft das Gateway den Schlüssel, bevor es den Request
weiterleitet. Ein begrenzter Schlüssel, dessen
remain_quotanull erreicht hat, wird als exhausted abgelehnt — der Aufruf erreicht nie das Modell.
unlimited_quota = true) überspringt diese
Guthaben-Prüfung vollständig; er ist nur durch das Workspace-Guthaben und durch
jegliche anderen Limits auf Schlüsselebene, die Sie setzen, begrenzt
(Modell-Allowlist, IP-Allowlist, Ablauf).
3. Ein konkretes Beispiel
Angenommen, Sie deployen einen geplanten Summarization-Agenten und möchten garantieren, dass er nie mehr als $25 ausgeben kann, egal was das Modell tut. Setzen Sie das Cap, wenn Sie den Schlüssel erstellen:unlimited_quota = false
und ein remain_quota im Wert von 25 treffen, ist der Schlüssel erschöpft, und jeder
weitere /v1/*-Aufruf wird abgelehnt — ohne dass Sie ein Dashboard beobachten
und ohne den Rest des Workspaces anzufassen.
Um denselben Schlüssel später unbegrenzt zu machen, bearbeiten Sie ihn und
schalten den unlimited-Toggle um — die Konsole setzt unlimited_quota = true und credit_limit_usd = 0 zusammen, und der Schlüssel kann wieder auf
das volle Workspace-Guthaben ziehen.
4. Welchen Modus wählen
Agent- / Automatisierungs-Schlüssel → begrenzt
Agent- / Automatisierungs-Schlüssel → begrenzt
Jeder Schlüssel, der einem autonomen Agenten, einem CI-Job oder einer
Drittanbieter-Integration übergeben wird, sollte begrenzt sein. Ein
Ausgabenlimit ist die billigste Garantie, dass eine
Prompt-Injection-Schleife oder ein Retry-Sturm keine unbegrenzte Rechnung
auflaufen lassen kann — das Cap stoppt den Schlüssel, bevor sich der Schaden
aufaddiert. Kombinieren Sie es mit einem engen
Modell-Limit und einer
IP-Allowlist.
Kurzlebige / Experiment-Schlüssel → begrenzt + Ablauf
Kurzlebige / Experiment-Schlüssel → begrenzt + Ablauf
Für einen Schlüssel, der nur für eine Demo, einen Lasttest oder ein
einzelnes Deployment existiert, kombinieren Sie ein kleines
credit_limit_usd mit einer expired_time. Der Schlüssel zieht sich von
selbst zurück, je nachdem, welches Limit er zuerst trifft. Siehe
Kontingent-Cap & Ablauf und
Ablaufende Schlüssel.Vertrauenswürdige interne / High-Volume-Schlüssel → unbegrenzt
Vertrauenswürdige interne / High-Volume-Schlüssel → unbegrenzt
Ein Schlüssel, der von einem Kern-Produktionsdienst verwendet wird, den Sie
vollständig kontrollieren, wo ein Pro-Schlüssel-Cap nur spurious Ausfälle
verursachen würde, kann unbegrenzt bleiben — das Workspace-Guthaben ist der
Backstop. Halten Sie diese Schlüssel wenige, benennen Sie sie klar und
fassen Sie sie trotzdem mit Modell- und IP-Limits.
5. Wie die Cap-Felder zusammenhängen
Die drei Felder, die dies steuern, sind ein einzelner Schalter mit einem abgeleiteten Saldo — Sie setzen das Dollar-Cap, das Gateway leitet den Rest ab:| Feld | Bedeutung |
|---|---|
credit_limit_usd | Ihre Eingabe. > 0 = begrenztes Cap in USD; 0 = unbegrenzt. |
unlimited_quota | true, wenn der Schlüssel kein Cap hat; automatisch auf false gesetzt, wenn Sie ein positives credit_limit_usd geben. |
remain_quota | Abgeleiteter Ausgabenspielraum für einen begrenzten Schlüssel; null zu erreichen erschöpft den Schlüssel. |
credit_limit_usd (oder unlimited_quota) im Editor.
remain_quota und used_quota werden vom Gateway gepflegt, während der
Schlüssel Nutzung abrechnet — sie sind schreibgeschützte Telemetrie, in den
Nutzungsansichten der Konsole sichtbar gemacht.
6. Wo das im Control-Stack sitzt
Ein Ausgabenlimit begrenzt, wie viel ein Schlüssel tun kann; der Rest des Scopes des Schlüssels begrenzt, was er tun kann. Die beiden komponieren:Kontingent-Cap & Ablauf
Kombinieren Sie ein Dollar-Cap mit einem absoluten Ablauf, sodass ein
Schlüssel sich von selbst zurückzieht, je nachdem, welches Limit er zuerst
trifft.
Das Token-Objekt
Jedes Feld, das ein Schlüssel trägt — Modell-Limits, IP-Allowlist,
Policy-Bindungen, Umgebungs-Label — in einer Referenz.
Least-Agency-Checkliste
Das vollständige Rezept für den engstmöglichen Schlüssel, eine
Beschränkung nach der anderen.
Scope, Schlüssel & Policies
Wie das Cap in die Workspace → Policy → Schlüssel-Hierarchie passt und wie
das Begrenzen eines Schlüssels den Blast-Radius schrumpft.
