1. Das API-Key-Ausgabenlimit: credit_limit_usd
credit_limit_usd ist die Lebenszeit-Ausgaben-Obergrenze für einen Schlüssel,
ausgedrückt in schlichten USD. Sie tippen eine Dollar-Zahl in den
Schlüssel-Editor; OrcaRouter wandelt sie in das Startkontingent des Schlüssels
um und rechnet jeden Aufruf dagegen ab.
Begrenzt
credit_limit_usd: 25 prägt einen Schlüssel mit $25 an Ausgaben.
Jeder Aufruf belastet seine Kosten; sobald das verbleibende Guthaben null
erreicht, hört der Schlüssel auf zu autorisieren, und jeder weitere Request
wird abgelehnt.Unbegrenzt
credit_limit_usd: 0 ist der Sentinel für kein Cap — der Schlüssel
zieht auf Ihr Workspace-Guthaben ohne Pro-Schlüssel-Obergrenze. Bequem,
aber der schlimmste Blast-Radius, wenn er leakt.2. Wie das Cap abgerechnet wird: remain_quota & used_quota
Das Dollar-Cap, das Sie eingeben, ist die menschenzugewandte Oberfläche.
Darunter führt das Gateway zwei laufende Zähler auf dem Schlüssel:
| Feld | Bedeutung |
|---|---|
remain_quota | Verbleibende Ausgaben, bevor der Schlüssel aufhört zu autorisieren. |
used_quota | Bisher über die Lebensdauer des Schlüssels verbrauchte Ausgaben. |
credit_limit_usd zu setzen, sät remain_quota aus dieser
Dollar-Zahl; jeder abgerechnete Aufruf verschiebt Kosten von remain_quota
in used_quota. Ein Schlüssel mit einem unbegrenzten Cap trägt stattdessen
unlimited_quota, und die Guthaben-Prüfung wird vollständig übersprungen.
Ein Guardrail- oder Firewall-Block kostet nichts gegen das Cap, wenn er
feuert, bevor das Modell läuft — ein
guardrail_blocked der Input-Stage und
ein inbound firewall_blocked passieren beide vor der Abrechnung, sodass
remain_quota unberührt bleibt. Ein Guardrail-Block der Output-Stage
erstattet den Request zurück. Siehe
Guardrails und Firewall.3. Auto-Ablauf: expired_time
expired_time ist eine absolute Sperrgrenze — ein Unix-Epoch-Zeitstempel
(Sekunden), nach dem der Schlüssel aufhört zu autorisieren, egal wie viel
Budget übrig ist.
- Ein zukünftiger Zeitstempel lässt den Schlüssel zu diesem Augenblick ablaufen. Das Gateway vergleicht ihn bei jedem Request gegen die aktuelle Zeit und lehnt den Aufruf ab, sobald er vergangen ist.
-1ist der Sentinel für läuft nie ab.
4. Ein konkreter gedeckelter, ablaufender Schlüssel
Ein nächtlicher Job, der Rechnungen mit einem billigen Modell abgleicht, für ein zweiwöchiges Pilot-Projekt läuft und nie mehr als ein paar Dollar pro Nacht kosten sollte, braucht fast keine Agency. Konfigurieren Sie seinen Schlüssel im Konsolen-Schlüssel-Editor (/console/token — Developer+):
Das Ausgabenlimit setzen
credit_limit_usd: 40 — das ganze Budget des Pilots. Eine außer Kontrolle
geratene Retry-Schleife erschöpft den Schlüssel, nicht Ihr
Workspace-Guthaben.Den Ablauf setzen
expired_time: der Unix-Zeitstempel für das Ende des Pilot-Fensters. Der
Schlüssel läuft automatisch ab und kann nach Auslieferung des Pilots nicht
wiederverwendet werden.Beide Felder sind USD-und-Zeit auf dem Schlüssel, keine workspace-weite Policy.
Um die Ausgaben eines einzelnen Agentenlaufs zu deckeln (statt der
Lebensdauer eines Schlüssels), ist das
cap_cost-Verdikt der Firewall der
Schutzschalter pro Lauf — siehe
Firewall-Regeln. Die beiden komponieren: das
Schlüssel-Cap begrenzt die Lebensdauer, cap_cost begrenzt einen einzelnen
Lauf.5. Wer diese setzen kann
credit_limit_usd und expired_time zu setzen ist Teil des Erstellens oder
Bearbeitens eines Schlüssels, was die Rolle Developer oder höher
erfordert. Jedes Workspace-Mitglied kann den maskierten Datensatz eines
Schlüssels lesen; nur Developer+ können seine Limits ändern. Schlüssel werden
bei der Anzeige maskiert — der Klartext wird einmal bei der Erstellung gezeigt
(siehe Schlüsselmaskierung).
6. Standardmäßig begrenzt
Ein Schlüssel mitcredit_limit_usd: 0 und expired_time: -1 hat kein
Ausgabenlimit und läuft nie ab — maximale Agency, schlimmster Blast-Radius.
Machen Sie das zur bewussten Ausnahme, nicht zum Default.
Unbegrenzt vs. begrenzt
Wann ein ungedeckelter, nicht ablaufender Schlüssel tatsächlich die richtige
Wahl ist — und wann nicht.
Least-Agency-Checkliste
Schicken Sie jeden Produktionsschlüssel durch denselben Härtungs-Durchgang,
bevor er ausgeliefert wird.
7. Verwandtes
Das Token-Objekt
Jedes Feld auf einem Schlüssel, einschließlich der Kontingent-Zähler.
Policies binden
Hängen Sie ein Guardrail und eine Firewall-Policy an denselben Schlüssel.
Übermäßige Agency
Die Bedrohung, die Ausgabenlimits und Ablauf einzudämmen gebaut sind.
