1. La checklist de moindre agence
Faites passer chaque clé — nouvelle ou existante — par ces six barrières dans l’éditeur de clé (/console/token). Définir l’une d’elles requiert le rôle
Developer ou supérieur ; les deux plans de politique (§5–6) sont rédigés
séparément et liés ici.
model_limits — épingler les modèles
model_limits — épingler les modèles
Définissez
model_limits à la liste exacte dont cet agent a besoin (et
activez model_limits_enabled). Un appel à tout modèle hors de la liste est
rejeté avant de quitter la passerelle, de sorte qu’un agent détourné ne peut
pas escalader vers un modèle plus cher ou plus capable.
Vérification : la liste est-elle aussi courte que le job le permet —
idéalement un seul modèle ?
Profondeur : Limites de modèles.allow_ips — épingler la source
allow_ips — épingler la source
Définissez
allow_ips aux adresses source ou CIDR depuis lesquels l’agent
appelle réellement. Une clé fuitée présentée depuis ailleurs est rejetée à la
couche d’authentification. Vide signifie que toutes les IPs sont
autorisées.
Vérification : pour un agent à hôte fixe ou planifié, la liste est-elle
non vide et scopée à cet egress ? Profondeur :
Allow-list d’IP.credit_limit_usd — plafonner la dépense
credit_limit_usd — plafonner la dépense
Définissez
credit_limit_usd à un plafond que l’agent ne devrait jamais
franchir au cours de sa vie. La passerelle l’applique contre la dépense de la
clé. 0 signifie illimité — une boucle emballée peut vider tout votre
solde.
Vérification : le plafond est-il un vrai budget, pas 0 ? Profondeur :
Quota, plafond & expiration.expired_time — lui donner une échéance
expired_time — lui donner une échéance
Définissez
expired_time à une expiration absolue — la fin du sprint, du
déploiement, ou de l’exécution CI. -1 signifie n’expire jamais. Une clé
à courte durée de vie ne peut pas s’attarder comme surface d’attaque oubliée.
Vérification : une clé éphémère ou de prestataire a-t-elle une vraie
expiration, pas -1 ? Profondeur :
Clés expirantes.guardrail_id — lier une politique de contenu
guardrail_id — lier une politique de contenu
Attachez un guardrail via
guardrail_id pour que
le texte de la requête (et, là où c’est supporté, de la réponse) soit filtré
pour la PII, les secrets, et l’intention d’injection avant qu’il n’atteigne
le modèle.
Vérification : une clé qui manipule des prompts sensibles a-t-elle un
guardrail lié, ou hérite-t-elle d’un défaut d’espace de travail ? Voir §5.firewall_policy_id — lier une politique d'outils
firewall_policy_id — lier une politique d'outils
Attachez une politique firewall via
firewall_policy_id pour que chaque appel d’outil, dispatch MCP, et egress
que cette clé émet soit évalué contre une allow-list de ce dont l’agent a
légitimement besoin.
Vérification : un agent qui appelle des outils a-t-il une politique
firewall liée, ou hérite-t-il du défaut d’espace de travail ? Voir §6.2. Quoi / à quelle fréquence / où
Trois questions transforment la checklist d’une corvée ponctuelle en une posture.Quoi
Les six barrières ci-dessus, dans l’ordre :
model_limits → allow_ips →
credit_limit_usd → expired_time → guardrail_id →
firewall_policy_id.À quelle fréquence
Sur chaque clé à la création, et lors d’une revue récurrente — quand
la portée d’un agent change, quand vous faites la
rotation d’une clé, et à une cadence fixe pour
les clés à longue durée de vie.
Où
Dans l’éditeur de clé de la console (
/console/token), en tant que
Developer+. Les deux politiques sont rédigées dans leurs propres
consoles, puis liées sur la clé.3. Une clé concrète à moindre agence
Un agent planifié qui résume les tickets de support avec un seul modèle bon marché, depuis un seul hôte, n’a presque besoin d’aucune agence. Une clé entièrement durcie :| Champ | Valeur | Pourquoi |
|---|---|---|
model_limits | un modèle de résumé | ne peut pas escalader vers un modèle frontière |
allow_ips | le CIDR d’egress du planificateur | une clé fuitée est inutile ailleurs |
credit_limit_usd | un plafond hebdomadaire | une boucle emballée ne peut pas vider le solde |
expired_time | fin du déploiement | expire automatiquement, ne peut pas s’attarder |
guardrail_id | un guardrail de masquage de PII | le texte de la requête est filtré |
firewall_policy_id | n’autorise que ses outils | aucun appel d’outil surprise |
4. L’appel de relais /v1 vs la console
La checklist est configurée dans la console avec votre session (un utilisateur Developer+). Votre agent ne touche jamais ces routes de config — il présente sa clé de relais à portée limitée (sk-orca-…) sur les appels
d’inférence /v1/*, et les limites et politiques liées ci-dessus sont appliquées
sur chacun.
model_limits de la clé n’inclut pas openai/gpt-4o-mini, cet appel est
rejeté avant de quitter la passerelle. Si l’IP de l’appelant n’est pas dans
allow_ips, il est rejeté à la couche d’authentification. Le code de l’agent
reste le même ; la clé décide le rayon d’explosion.
5. Barrière 5 — le guardrail lié
guardrail_id lie une politique de contenu ordonnée et à portée d’espace de
travail à la clé. La résolution est le guardrail explicite de la clé (s’il existe
et est activé), sinon le défaut de l’espace de travail, sinon aucun.
Les guardrails sont un interrupteur d’arrêt strict lorsqu’ils sont
désactivés : un
guardrail_id désactivé ou supprimé signifie que la clé ne
reçoit aucun guardrail — il ne retombe pas sur le défaut de l’espace de
travail. C’est l’opposé du plan firewall (§6), alors vérifiez que le guardrail
lié est activé, pas seulement attaché.block,
mask, ou flag. Le preset PII Shield, par exemple, masque la PII dans la
requête avant qu’elle n’atteigne le modèle. Rédigez et attachez les guardrails en
tant que Developer+ — voir Guardrails et
Lier des politiques.
6. Barrière 6 — la politique firewall liée + portée de passerelle
firewall_policy_id lie une politique d’appels d’outils à portée d’espace de
travail. Elle gouverne les actions qu’un agent entreprend — outils annoncés,
tool_calls émis par le modèle, dispatchs MCP, et egress sortant — contre une
liste de règles ordonnée dont les verdicts sont allow, audit, deny,
sanitize, pending_approval, ou cap_cost.
Le plan firewall se résout différemment des guardrails : une politique
firewall attachée mais désactivée retombe sur le défaut de l’espace de
travail, elle ne coupe pas l’application. Donc lier une politique et la
désactiver ramène la clé au défaut de l’espace de travail — elle ne devient
jamais silencieusement non protégée.
tight / balanced /
permissive), avec annulation en un clic. Voir
Firewall §8.
7. Après la checklist
Référentiel secure-agents
La posture de départ recommandée — un interrupteur d’autonomie, puis ajustez
à partir du trafic réel.
Lier des politiques
Comment
guardrail_id et firewall_policy_id s’attachent et se résolvent.Agence excessive
La menace que cette checklist est conçue pour contenir.
Clé fuitée
Que faire dès l’instant où une clé à portée limitée est exposée.
