1. Les deux modes
Chaque clé se résout exactement à l’un de deux états :Illimité
unlimited_quota = true. La clé tire sur le solde de l’espace de travail
sans plafond par clé. Aucune vérification de dépense ne s’exécute au moment
de la requête — la seule limite est le solde propre de l’espace de travail.Borné
credit_limit_usd > 0. La clé porte son propre plafond de dépense à vie en
USD. Une fois que la dépense cumulée atteint le plafond, la clé cesse de
fonctionner — le reste de l’espace de travail est intact./console/token).
Créer ou modifier une clé requiert le rôle Developer ou supérieur.
credit_limit_usd = 0 signifie illimité — zéro est la sentinelle pour
« aucun plafond », pas « un plafond de zéro dollar ». Pour borner une clé,
donnez-lui un montant en dollars positif.2. Comment un quota de clé API est appliqué
Lorsque vous fixezcredit_limit_usd à un nombre positif, la passerelle le
convertit en un solde interne remain_quota pour cette clé et bascule
unlimited_quota sur false. Dès lors :
remain_quotaest la marge de dépense restante de la clé, déduite au fur et à mesure que la clé facture son usage.used_quotaest la dépense cumulée que la clé a déjà comptabilisée.- À chaque appel de relais, la passerelle vérifie la clé avant de transmettre la
requête. Une clé bornée dont le
remain_quotaa atteint zéro est rejetée comme épuisée — l’appel n’atteint jamais le modèle.
unlimited_quota = true) ignore entièrement cette
vérification de solde ; elle n’est bornée que par le solde de l’espace de travail
et par toute autre limite au niveau de la clé que vous définissez (allow-list de
modèles, allow-list d’IP, expiration).
3. Un exemple concret
Disons que vous déployez un agent de résumé planifié et que vous voulez garantir qu’il ne peut jamais dépenser plus de 25 $ peu importe ce que fait le modèle. Définissez le plafond lorsque vous créez la clé :unlimited_quota = false et un
remain_quota valant 25 , la
clé est épuisée et tout appel /v1/* supplémentaire est rejeté — sans que vous
surveilliez un tableau de bord, et sans toucher au reste de l’espace de travail.
Pour rendre la même clé illimitée plus tard, modifiez-la et basculez
l’interrupteur illimité — la console fixe unlimited_quota = true et
credit_limit_usd = 0 ensemble, et la clé peut à nouveau tirer sur le solde
complet de l’espace de travail.
4. Quel mode choisir
Clés d'agent / automatisation → bornées
Clés d'agent / automatisation → bornées
Toute clé remise à un agent autonome, un job CI, ou une intégration tierce
devrait être bornée. Un plafond de dépense est la garantie la moins chère
qu’une boucle d’injection de prompt ou une tempête de retry ne peut pas faire
grimper une facture non bornée — le plafond arrête la clé avant que les
dégâts s’aggravent. Associez-le à une limite de
modèle serrée et une
allow-list d’IP.
Clés à courte durée de vie / d'expérimentation → bornées + expiration
Clés à courte durée de vie / d'expérimentation → bornées + expiration
Pour une clé qui n’existe que pour une démo, un test de charge, ou un seul
déploiement, combinez un petit
credit_limit_usd avec un expired_time. La
clé se retire d’elle-même sur la première limite qu’elle atteint. Voir
Quota, plafond & expiration et
Clés expirantes.Clés internes de confiance / à fort volume → illimitées
Clés internes de confiance / à fort volume → illimitées
Une clé utilisée par un service de production central que vous contrôlez
entièrement, où un plafond par clé causerait juste des pannes parasites, peut
rester illimitée — le solde de l’espace de travail est le filet de sécurité.
Gardez ces clés peu nombreuses, nommez-les clairement, et scopez-les quand
même avec des limites de modèle et d’IP.
5. Comment les champs de plafond se rapportent
Les trois champs qui gouvernent ceci sont un seul interrupteur avec un solde dérivé — vous fixez le plafond en dollars, la passerelle dérive le reste :| Champ | Signification |
|---|---|
credit_limit_usd | Votre entrée. > 0 = plafond borné en USD ; 0 = illimité. |
unlimited_quota | true quand la clé n’a aucun plafond ; mis à false automatiquement quand vous donnez un credit_limit_usd positif. |
remain_quota | Marge de dépense dérivée pour une clé bornée ; atteindre zéro épuise la clé. |
credit_limit_usd (ou unlimited_quota) dans
l’éditeur. remain_quota et used_quota sont maintenus par la passerelle au fur
et à mesure que la clé facture l’usage — ce sont de la télémétrie en lecture
seule, exposée dans les vues d’usage de la console.
6. Où cela se situe dans la pile de contrôle
Un plafond de dépense borne combien une clé peut faire ; le reste de la portée de la clé borne *ce qu’*elle peut faire. Les deux se composent :Quota, plafond & expiration
Combinez un plafond en dollars avec une expiration absolue pour qu’une clé se
retire d’elle-même sur la première limite qu’elle atteint.
L'objet token
Chaque champ qu’une clé porte — limites de modèles, allow-list d’IP,
attachements de politique, étiquette d’environnement — dans une seule
référence.
Checklist de moindre agence
La recette complète de la clé la plus étroite possible, une contrainte à la
fois.
Portée, clés & politiques
Comment le plafond s’inscrit dans la hiérarchie espace de travail → politique
→ clé, et comment borner une clé rétrécit le rayon d’explosion.
