https://api.orcarouter.ai/v1/chat/completions avec la clé sk-orca-...
de chaque locataire — seule la politique dans la passerelle change. Les
actions de config nécessitent les rôles indiqués à chaque étape ; seuls les
appels de relais /v1/* utilisent une clé de locataire.1. Le modèle de sécurité IA multi-locataire
Une passerelle multi-locataire a une forme de menace différente d’une seule app. Les risques qui comptent passent à l’échelle avec le nombre de locataires :Fuite de clé = rayon d'explosion d'un locataire
Fuite de données inter-locataires
Un agent de locataire bruyant
Conformité par locataire
2. Le référentiel : une politique d’espace de travail dont chaque locataire hérite
Rédigez votre posture de sécurité une fois au niveau de l’espace de travail afin que chaque clé de locataire en hérite par défaut — aucune duplication par locataire.Un guardrail par défaut
tenant-baseline) et marquez-la comme défaut de l’espace de
travail (is_default). Ajoutez une règle PII, stage input, action
mask, afin qu’aucune requête de locataire ne porte de PII brute en
amont :Une politique firewall par défaut
balanced. Cela audite les appels d’outils de chaque locataire et
signale la PII à l’échelle de l’espace de travail tout en refusant les
actions les plus destructrices, de sorte que vous observiez le
comportement réel des locataires avant d’appliquer largement. Rôle
Developer.3. Une clé scopée par locataire
C’est le cœur de l’isolation de locataire : ne partagez jamais une clé entre locataires, et ne remettez jamais à un locataire votre clé à portée de compte. Frappez une clé par locataire, scopée exactement à ce que ce locataire peut faire. Dans API Keys → Nouvelle clé, définissez :Plafonner la dépense (frontière denial-of-wallet)
Plafonner la dépense (frontière denial-of-wallet)
credit_limit_usd sur le plafond de ce locataire (0 =
illimité). C’est le contrôle multi-locataire le plus important : une clé
de locataire fuitée ou abusée ne peut jamais brûler que le budget de ce
locataire, jamais votre compte. Voir
denial-of-wallet.Épingler les modèles
Épingler les modèles
model_limits (model_limits_enabled) et ne listez que le(s)
modèle(s) que le plan de ce locataire inclut — de sorte qu’une clé
fuitée ne puisse pas exécuter un modèle coûteux que le locataire n’a
jamais payé.Étiqueter l'environnement / le locataire
Étiqueter l'environnement / le locataire
environment (une étiquette de déploiement libre, par ex.
prod / staging) afin que le trafic d’un locataire soit attribuable
dans vos journaux et que vous puissiez distinguer les clés de production
des clés de test en un coup d’œil.Verrouiller l'origine et la durée de vie
Verrouiller l'origine et la durée de vie
allow_ips sur les IPs d’egress du backend de ce locataire
s’il appelle depuis un serveur fixe, et expired_time pour les
locataires en essai ou limités dans le temps (-1 = n’expire jamais).tenant-baseline de l’espace de travail et de la politique firewall par
défaut — vous avez frappé une clé scopée, et elle est déjà gouvernée. La
clé est masquée à l’affichage après création, donc copiez-la une seule
fois quand vous provisionnez le locataire.
4. Overrides par locataire — resserrer un sans toucher le reste
La plupart des locataires chevauchent le référentiel. Quand l’un a besoin de plus — un locataire réglementé, un palier entreprise, un locataire sur une liste de probation — attachez une politique nommée plus stricte à cette clé uniquement :| Défini sur la clé | Effet pour ce seul locataire |
|---|---|
guardrail_id | Échange contre un guardrail nommé plus strict (par ex. block-on-PII). |
firewall_policy_id | Échange contre une politique firewall plus serrée (par ex. deny par défaut sur les outils). |
Guardrails : l'attachement explicite est l'interrupteur d'arrêt
Guardrails : l'attachement explicite est l'interrupteur d'arrêt
guardrail_id explicite (lorsqu’il existe et est activé) s’applique
toujours et ne retombe jamais silencieusement. Si ce guardrail
attaché est désactivé, la clé n’obtient aucun guardrail — elle
ne retombe pas sur le défaut de l’espace de travail. Laissez
guardrail_id non défini (0/null) pour hériter du défaut
tenant-baseline.Firewall : un attachement désactivé retombe
Firewall : un attachement désactivé retombe
firewall_policy_id attaché s’applique lorsqu’il existe et est
activé ; si cette politique est désactivée, la clé retombe sur la
politique firewall par défaut de l’espace de travail. (C’est l’opposé
du comportement de l’interrupteur d’arrêt du guardrail — par
conception.)5. Un exemple concret à deux paliers
Disons que vous exploitez un palier gratuit et un palier entreprise réglementé sur un seul espace de travail :- Référentiel d’espace de travail — guardrail
tenant-baseline(masque PII sur input, block sur carte/SSN) commeis_default, plus le niveau d’autonomie firewallbalanced. Chaque locataire en hérite. - Clé de locataire palier gratuit — pas de
guardrail_id(hérite du référentiel),model_limitsépinglé àopenai/gpt-4o-mini, uncredit_limit_usdbas. - Clé de locataire entreprise —
guardrail_iddéfini sur un guardrailenterprise-piiplus strict (PII block, pas mask, sur input ; block de secrets au stageoutput), unfirewall_policy_idavec une allow-list d’outils plus serrée, un plafond de crédit plus élevé, etallow_ipsépinglé sur leur backend.
/v1/chat/completions avec leur
propre clé. La passerelle résout la bonne politique par clé — votre code
d’application est identique pour chaque locataire.
6. Conformité et résidence par locataire
Un locataire réglementé a souvent besoin d’une attestation dont le reste n’a pas besoin. La conformité s’exécute comme un pair d’espace de travail des guardrails et du firewall :- Parcourir le catalogue de frameworks et l’état de préparation est ouvert à
tout Member et gratuit — confirmez la couverture pour le framework
qu’un locataire demande (
soc2,hipaa,gdpr,iso_27001,pci_dss, et plus). - Installer un pack (
POST /api/compliance/packs/:key/install) matérialise les guardrails et politiques firewall correspondants dans votre espace de travail ; cela nécessite Admin de l’espace de travail et un plan payant. - La résidence des données épingle la région de votre artefact de
rapport de conformité (
us/eu/uk/ap/cn/global) viaPUT /api/compliance/residency(Admin). Les lectures inter-régions sont refusées.
7. Surveillez chaque locataire depuis un seul espace de travail
Toute l’observabilité est à portée d’espace de travail, de sorte qu’un seul jeu de flux couvre tous vos locataires — filtrable jusqu’à un seul :- Guardrails → Matches (tout Member) — chaque règle qui s’est déclenchée à travers tous les locataires : type, action, stage, détail. La sous-chaîne correspondante n’est enregistrée que si Log raw content est activé pour ce guardrail (désactivé par défaut — la posture prudente en matière de vie privée, qui compte le plus en multi-locataire). Marquez un faux positif pour ajuster (Admin).
- Firewall → Events / Runs (Developer+) — chaque appel d’outil, agrégé par exécution d’agent, de sorte que la boucle d’un locataire bruyant ou un egress inédit ressorte.
- Flux d’anomalies (Member) — les pics de débit/coût scorés contre une baseline heure-de-la-semaine apprise attrapent un locataire qui brûle hors de son motif même quand chaque appel est individuellement autorisé.
guardrail_blocked /
firewall_blocked), ne coûte aucun quota à ce locataire, et est marquée
skip-retry — la frontière a tenu sans facturer le locataire pour le rejet.
