1. Pourquoi des clés API à portée limitée pour les agents LLM
Une clé API généraliste est une credential au porteur : quiconque la détient peut appeler n’importe quel modèle, depuis n’importe où, pour n’importe quel montant, sans aucune politique attachée. C’est l’opposé de ce dont un agent autonome a besoin. Sur OrcaRouter, une clé API n’est pas qu’une credential — c’est une déclaration de portée. Chaque clé porte ses propres contraintes (quels modèles, quelles IPs, combien de dépenses, quand elle expire) et pointe vers le guardrail et la politique firewall qui gouvernent son trafic. Modifier la politique vers laquelle pointe une clé prend effet à la requête suivante, sans redéploiement et sans changement de code d’agent. Le principe est la moindre agence : donnez à chaque agent l’identité la plus étroite qui lui permette encore de faire son travail, et rien de plus. Une clé, un agent, un objectif.2. Ce que porte une clé à portée limitée
Chaque clé est un ensemble de limites plus deux attachements de politique. Chaque champ est documenté sur sa propre page — les liens spoke ci-dessous mènent à la profondeur.Limites de modèles
model_limits restreint une clé à une liste nommée de modèles. Un appel
hors de la liste est rejeté avant de quitter la passerelle — l’agent ne peut
pas basculer vers un modèle plus cher ou plus capable.Allow-list d'IP
allow_ips épingle une clé à des adresses source spécifiques. Une clé
fuitée présentée depuis ailleurs est rejetée à la couche d’authentification.Quota, plafond & expiration
credit_limit_usd plafonne la dépense à vie (0 = illimité) ;
expired_time fixe une expiration absolue (-1 = jamais).Environnements
environment est une étiquette libre (prod, staging, dev) pour
organiser les clés et filtrer les logs.Lier des politiques
guardrail_id et firewall_policy_id attachent une politique de contenu et
une politique d’appels d’outils à la clé. Aucun attachement retombe sur le
défaut de l’espace de travail.L'objet token
La référence complète champ par champ d’une clé, y compris
remain_quota /
used_quota et is_firewall_gateway.Borné vs non borné. Une clé avec
credit_limit_usd: 0 et
expired_time: -1 n’a aucun plafond de dépense et n’expire jamais — pratique,
mais le pire rayon d’explosion si elle fuite. Voir
illimité vs borné pour savoir quand
chacun est approprié.3. Une clé concrète à moindre agence
Un agent planifié qui résume les tickets de support avec un seul modèle bon marché et tourne depuis un seul hôte n’a presque besoin d’aucune agence. Une clé bien scopée pour lui :| Champ | Valeur | Pourquoi |
|---|---|---|
model_limits | un modèle de résumé | ne peut pas escalader vers un modèle frontière |
allow_ips | le CIDR d’egress du planificateur | une clé fuitée est inutile ailleurs |
credit_limit_usd | un plafond hebdomadaire | une boucle emballée ne peut pas vider le solde |
expired_time | fin du déploiement | expire automatiquement, ne peut pas s’attarder |
guardrail_id | un guardrail de masquage de PII | le texte de la requête est filtré |
firewall_policy_id | n’autorise que les outils dont il a besoin | aucun appel d’outil surprise |
4. Lier les deux plans de politique
Les deux attachements sont les champs les plus puissants d’une clé, et ils se résolvent différemment lorsqu’une politique attachée est désactivée :guardrail_id — filtrage de contenu
guardrail_id — filtrage de contenu
Filtre le texte de la requête et de la réponse (PII, secrets, injection
de prompt) contre un guardrail ordonné et à
portée d’espace de travail. Résolution : un
guardrail_id explicite et
activé s’applique ; un désactivé est l’interrupteur d’arrêt — il ne
retombe pas sur le défaut de l’espace de travail. Sans attachement, le
guardrail par défaut de l’espace de travail s’applique, sinon rien.firewall_policy_id — application des appels d'outils
firewall_policy_id — application des appels d'outils
Gouverne les actions qu’un agent entreprend — appels d’outils, dispatchs
MCP, egress — contre une politique firewall à
portée d’espace de travail. La résolution diffère des guardrails : une
politique firewall attachée mais désactivée retombe sur le défaut de
l’espace de travail, elle ne coupe pas l’application.
is_firewall_gateway — un type de clé différent
is_firewall_gateway — un type de clé différent
Un token à portée de passerelle est frappé uniquement pour les routes
Firewall MCP et evaluate-hook (
/api/v1/firewall/*), jamais pour
l’inférence. Une clé ordinaire reçoit un 403 là. Activer ce flag, et lire
le plaintext de la clé de passerelle, requiert Admin+.5. La section clés
Gérer les clés
Créer, modifier et révoquer des clés dans la console.
Rotation
Renouveler une clé sans interruption.
Clés expirantes
Clés à courte durée de vie pour les agents éphémères et les exécutions CI.
Masquage des clés
Les clés sont masquées à l’affichage ; le plaintext est montré une fois à la
création.
Clé fuitée
Que faire dès l’instant où une clé est exposée.
Checklist de moindre agence
Faites passer chaque clé par la même passe de durcissement.
6. Où les clés se situent dans la pile de contrôle
Une clé à portée limitée est la première couche de défense — elle décide qui est l’appelant et ce qu’il peut atteindre avant qu’aucune politique ne s’exécute. Les Guardrails et le Firewall sont les couches suivantes.Sécuriser les agents IA
Pourquoi l’identité de l’agent est le fondement de la pile de contrôle.
Guardrails vs Firewall
Les deux plans de politique auxquels une clé peut se lier.
Agence excessive
La menace que les clés à moindre agence sont conçues pour contenir.
