Zum Hauptinhalt springen
Ein kompromittierter Agent hört nicht von selbst auf. Eine Prompt-Injection, die ihn in eine Retry-Schleife trickst, oder ein geleakter Schlüssel in einem CI-Log wird weiter Modelle aufrufen, bis irgendetwas Stopp sagt. Auf OrcaRouter ist dieses „irgendetwas” zwei Felder auf dem Schlüssel selbst: ein Ausgabenlimit und ein Ablauf. Setzen Sie sie einmal im Schlüssel-Editor, und das Gateway setzt beide bei jedem Request durch — keine Änderung im Agenten-Code, kein Redeploy. Diese Seite ist die fokussierte Referenz für diese beiden Limits. Für die vollständige Schlüsselfeld-Liste siehe das Token-Objekt; für das Identitätsmodell um sie herum siehe Übersicht über Scoped Keys.

1. Das API-Key-Ausgabenlimit: credit_limit_usd

credit_limit_usd ist die Lebenszeit-Ausgaben-Obergrenze für einen Schlüssel, ausgedrückt in schlichten USD. Sie tippen eine Dollar-Zahl in den Schlüssel-Editor; OrcaRouter wandelt sie in das Startkontingent des Schlüssels um und rechnet jeden Aufruf dagegen ab.

Begrenzt

credit_limit_usd: 25 prägt einen Schlüssel mit $25 an Ausgaben. Jeder Aufruf belastet seine Kosten; sobald das verbleibende Guthaben null erreicht, hört der Schlüssel auf zu autorisieren, und jeder weitere Request wird abgelehnt.

Unbegrenzt

credit_limit_usd: 0 ist der Sentinel für kein Cap — der Schlüssel zieht auf Ihr Workspace-Guthaben ohne Pro-Schlüssel-Obergrenze. Bequem, aber der schlimmste Blast-Radius, wenn er leakt.
0 bedeutet nicht „null Dollar” — es bedeutet unbegrenzt. Ein Schlüssel, den Sie auf ein winziges Budget zusperren wollten, muss eine positive Zahl tragen. Um auszudrücken „dieser Schlüssel darf nichts ausgeben”, deaktivieren oder löschen Sie ihn, setzen Sie das Cap nicht auf 0.

2. Wie das Cap abgerechnet wird: remain_quota & used_quota

Das Dollar-Cap, das Sie eingeben, ist die menschenzugewandte Oberfläche. Darunter führt das Gateway zwei laufende Zähler auf dem Schlüssel:
FeldBedeutung
remain_quotaVerbleibende Ausgaben, bevor der Schlüssel aufhört zu autorisieren.
used_quotaBisher über die Lebensdauer des Schlüssels verbrauchte Ausgaben.
Ein positives credit_limit_usd zu setzen, sät remain_quota aus dieser Dollar-Zahl; jeder abgerechnete Aufruf verschiebt Kosten von remain_quota in used_quota. Ein Schlüssel mit einem unbegrenzten Cap trägt stattdessen unlimited_quota, und die Guthaben-Prüfung wird vollständig übersprungen.
Ein Guardrail- oder Firewall-Block kostet nichts gegen das Cap, wenn er feuert, bevor das Modell läuft — ein guardrail_blocked der Input-Stage und ein inbound firewall_blocked passieren beide vor der Abrechnung, sodass remain_quota unberührt bleibt. Ein Guardrail-Block der Output-Stage erstattet den Request zurück. Siehe Guardrails und Firewall.

3. Auto-Ablauf: expired_time

expired_time ist eine absolute Sperrgrenze — ein Unix-Epoch-Zeitstempel (Sekunden), nach dem der Schlüssel aufhört zu autorisieren, egal wie viel Budget übrig ist.
  • Ein zukünftiger Zeitstempel lässt den Schlüssel zu diesem Augenblick ablaufen. Das Gateway vergleicht ihn bei jedem Request gegen die aktuelle Zeit und lehnt den Aufruf ab, sobald er vergangen ist.
  • -1 ist der Sentinel für läuft nie ab.
Die zwei Limits sind unabhängig, und beide müssen bestehen. Ein Schlüssel mit verbleibendem Budget, aber einer vergangenen expired_time ist tot; ein Schlüssel innerhalb seines Gültigkeitsfensters mit remain_quota auf null ist tot. Welche Grenze auch immer zuerst auslöst, gewinnt. Der Editor lehnt einen in der Vergangenheit gesetzten Ablauf ab, sodass Sie nicht versehentlich einen geboren-abgelaufenen Schlüssel prägen können.
Für kurzlebige Schlüssel, die pro CI-Lauf oder pro ephemerem Agenten geprägt werden, siehe Ablaufende Schlüssel.

4. Ein konkreter gedeckelter, ablaufender Schlüssel

Ein nächtlicher Job, der Rechnungen mit einem billigen Modell abgleicht, für ein zweiwöchiges Pilot-Projekt läuft und nie mehr als ein paar Dollar pro Nacht kosten sollte, braucht fast keine Agency. Konfigurieren Sie seinen Schlüssel im Konsolen-Schlüssel-Editor (/console/tokenDeveloper+):
1

Das Ausgabenlimit setzen

credit_limit_usd: 40 — das ganze Budget des Pilots. Eine außer Kontrolle geratene Retry-Schleife erschöpft den Schlüssel, nicht Ihr Workspace-Guthaben.
2

Den Ablauf setzen

expired_time: der Unix-Zeitstempel für das Ende des Pilot-Fensters. Der Schlüssel läuft automatisch ab und kann nach Auslieferung des Pilots nicht wiederverwendet werden.
3

Mit den anderen Scopes kombinieren

Fügen Sie model_limits hinzu, sodass er nicht zu einem Frontier-Modell eskalieren kann, und allow_ips, sodass ein geleakter Schlüssel abseits des Hosts des Schedulers nutzlos ist.
Wenn dieser Agent an Tag drei gekapert wird, ist der Schaden auf das begrenzt, was von seinen $40 übrig ist, und der ganze Schlüssel ist nach elf Tagen ohnehin weg. Der Rest des Workspaces bleibt unberührt.
Beide Felder sind USD-und-Zeit auf dem Schlüssel, keine workspace-weite Policy. Um die Ausgaben eines einzelnen Agentenlaufs zu deckeln (statt der Lebensdauer eines Schlüssels), ist das cap_cost-Verdikt der Firewall der Schutzschalter pro Lauf — siehe Firewall-Regeln. Die beiden komponieren: das Schlüssel-Cap begrenzt die Lebensdauer, cap_cost begrenzt einen einzelnen Lauf.

5. Wer diese setzen kann

credit_limit_usd und expired_time zu setzen ist Teil des Erstellens oder Bearbeitens eines Schlüssels, was die Rolle Developer oder höher erfordert. Jedes Workspace-Mitglied kann den maskierten Datensatz eines Schlüssels lesen; nur Developer+ können seine Limits ändern. Schlüssel werden bei der Anzeige maskiert — der Klartext wird einmal bei der Erstellung gezeigt (siehe Schlüsselmaskierung).

6. Standardmäßig begrenzt

Ein Schlüssel mit credit_limit_usd: 0 und expired_time: -1 hat kein Ausgabenlimit und läuft nie ab — maximale Agency, schlimmster Blast-Radius. Machen Sie das zur bewussten Ausnahme, nicht zum Default.

Unbegrenzt vs. begrenzt

Wann ein ungedeckelter, nicht ablaufender Schlüssel tatsächlich die richtige Wahl ist — und wann nicht.

Least-Agency-Checkliste

Schicken Sie jeden Produktionsschlüssel durch denselben Härtungs-Durchgang, bevor er ausgeliefert wird.

7. Verwandtes

Das Token-Objekt

Jedes Feld auf einem Schlüssel, einschließlich der Kontingent-Zähler.

Policies binden

Hängen Sie ein Guardrail und eine Firewall-Policy an denselben Schlüssel.

Übermäßige Agency

Die Bedrohung, die Ausgabenlimits und Ablauf einzudämmen gebaut sind.
Ein Ausgabenlimit und ein Ablauf sind die billigste Versicherung auf einem Schlüssel: zwei Zahlen, die eine offene Anmeldeinformation in eine verwandeln, die sicher versagt — leer oder abgelaufen — statt zu laufen, bis Ihre Rechnung es bemerkt.