Alles hier bindet an Ihren Workspace und wird aus der Konsole konfiguriert.
Ihre App ruft weiterhin
https://api.orcarouter.ai/v1/chat/completions mit dem
sk-orca-...-Schlüssel jedes Mandanten auf — nur die Policy im Gateway ändert
sich. Konfigurationsaktionen benötigen die pro Schritt genannten Rollen; nur
/v1/*-Relay-Aufrufe verwenden einen Mandanten-Schlüssel.1. Das Modell für mandantenfähige KI-Sicherheit
Ein mandantenfähiges Gateway hat eine andere Bedrohungsform als eine einzelne App. Die Risiken, die zählen, skalieren mit der Anzahl der Mandanten:Key-Leak = Blast-Radius eines Mandanten
Ein geleakter Mandanten-Schlüssel sollte nicht Ihr Konto leeren, Modelle
aufrufen, die Sie nie exponiert haben, oder über das Budget dieses
Mandanten hinausreichen können.
Cross-Mandant-Datenleck
Die PII eines Mandanten, die in geteilten Logs landet oder in einer Antwort,
die an einen anderen Mandanten geroutet wird, bricht Ihr
Datenisolations-Versprechen.
Ein lärmender Mandanten-Agent
Der Agent eines Mandanten, der auf einem Tool loopt oder beliebige Hosts
holt, sollte das Gateway nicht für alle anderen verschlechtern.
Pro-Mandant-Compliance
Ein regulierter Mandant kann PII-Masking und Datenresidenz brauchen, die der
Rest Ihrer Mandanten nicht braucht.
2. Die Baseline: eine Workspace-Policy, die jeder Mandant erbt
Verfassen Sie Ihre Sicherheitshaltung einmal auf Workspace-Ebene, sodass jeder Mandanten-Schlüssel sie per Default erbt — keine Pro-Mandant-Duplizierung.Ein Default-Guardrail
Verfassen Sie in Guardrails → Neues Guardrail eine benannte Policy (z. B.
Jeder Mandanten-Schlüssel mit keiner expliziten Guardrail-Bindung fällt
auf diesen Default zurück. Ein Guardrail zu verfassen erfordert die Rolle
Developer.
tenant-baseline) und markieren Sie sie als Workspace-Default
(is_default). Fügen Sie eine PII-Regel hinzu, Stage input, Aktion
mask, sodass kein Mandanten-Request rohe PII upstream trägt:Eine Default-Firewall-Policy
Wenn Ihre Mandanten Agenten betreiben, tun Sie dasselbe auf der
Aktionsebene: Verfassen Sie in Firewall → Policies eine Default-Policy
oder — schneller — öffnen Sie Firewall → Posture und wenden Sie das
balanced-Autonomie-Level
an. Das auditiert die Tool-Calls jedes Mandanten und flaggt PII
workspace-weit, während es die destruktivsten Aktionen ablehnt, sodass Sie
echtes Mandanten-Verhalten beobachten, bevor Sie breit durchsetzen.
Developer-Rolle.3. Ein eingegrenzter Schlüssel pro Mandant
Das ist der Kern der Mandanten-Isolation: teilen Sie nie einen Schlüssel über Mandanten hinweg und geben Sie einem Mandanten nie Ihren kontoweiten Schlüssel. Prägen Sie einen Schlüssel pro Mandant, eingegrenzt auf genau das, was dieser Mandant tun darf. Setzen Sie in API Keys → Neuer Schlüssel:Die Ausgaben begrenzen (Denial-of-Wallet-Grenze)
Die Ausgaben begrenzen (Denial-of-Wallet-Grenze)
Setzen Sie
credit_limit_usd auf die Obergrenze dieses Mandanten (0 =
unbegrenzt). Das ist die einzelne wichtigste mandantenfähige Kontrolle: Ein
geleakter oder missbrauchter Mandanten-Schlüssel kann immer nur das Budget
dieses Mandanten verbrennen, niemals Ihr Konto. Siehe
Denial-of-Wallet.Die Modelle festpinnen
Die Modelle festpinnen
Schalten Sie
model_limits ein (model_limits_enabled) und listen Sie nur
das/die Modell(e), das/die der Plan dieses Mandanten enthält — sodass ein
geleakter Schlüssel kein teures Modell ausführen kann, für das der Mandant
nie bezahlt hat.Die Umgebung / den Mandanten labeln
Die Umgebung / den Mandanten labeln
Setzen Sie
environment (ein freiformiges Deployment-Label, z. B. prod /
staging), sodass der Traffic eines Mandanten in Ihren Logs zurechenbar ist
und Sie Produktions-Schlüssel auf einen Blick von Test-Schlüsseln
unterscheiden können.Herkunft & Lebensdauer eingrenzen
Herkunft & Lebensdauer eingrenzen
Setzen Sie
allow_ips auf die Backend-Egress-IPs dieses Mandanten, wenn er
von einem festen Server aus aufruft, und expired_time für Trial- oder
zeitlich begrenzte Mandanten (-1 = läuft nie ab).tenant-baseline-
Guardrail und die Default-Firewall-Policy — Sie haben einen eingegrenzten
Schlüssel geprägt, und er ist bereits gesteuert. Der Schlüssel wird nach der
Erstellung bei der Anzeige maskiert, kopieren Sie ihn also einmal, wenn Sie
den Mandanten provisionieren.
4. Pro-Mandant-Overrides — einen verschärfen, ohne den Rest zu berühren
Die meisten Mandanten reiten auf der Baseline. Wenn einer mehr braucht — ein regulierter Mandant, ein Enterprise-Tier, ein Mandant auf einer Bewährungsliste — hängen Sie eine strengere benannte Policy an nur diesen Schlüssel:| Auf dem Schlüssel setzen | Effekt für diesen einen Mandanten |
|---|---|
guardrail_id | Tauscht ein strengeres benanntes Guardrail ein (z. B. Block-bei-PII). |
firewall_policy_id | Tauscht eine engere Firewall-Policy ein (z. B. Default-Deny-Tools). |
Guardrails: explizite Bindung ist der Aus-Schalter
Guardrails: explizite Bindung ist der Aus-Schalter
Eine explizite
guardrail_id (wenn sie existiert und aktiviert ist) gilt
immer und fällt nie stillschweigend zurück. Wenn dieses angehängte
Guardrail deaktiviert ist, bekommt der Schlüssel kein Guardrail — er
fällt nicht auf den Workspace-Default. Lassen Sie guardrail_id ungesetzt
(0/null), um den tenant-baseline-Default zu erben.Firewall: eine deaktivierte Bindung fällt zurück
Firewall: eine deaktivierte Bindung fällt zurück
Eine angehängte
firewall_policy_id gilt, wenn sie existiert und aktiviert
ist; wenn diese Policy deaktiviert ist, fällt der Schlüssel auf die
Default-Firewall-Policy des Workspaces zurück. (Das ist das Gegenteil des
Guardrail-Aus-Schalter-Verhaltens — beabsichtigt.)5. Ein konkretes Zwei-Tier-Beispiel
Angenommen, Sie betreiben einen Free-Tier und einen regulierten Enterprise-Tier auf einem Workspace:- Workspace-Baseline —
tenant-baseline-Guardrail (PII-Mask auf Input, Block bei Karte/SSN) alsis_default, plus dasbalanced-Firewall- Autonomie-Level. Jeder Mandant erbt dies. - Free-Tier-Mandanten-Schlüssel — keine
guardrail_id(erbt die Baseline),model_limitsfestgepinnt aufopenai/gpt-4o-mini, ein niedrigescredit_limit_usd. - Enterprise-Mandanten-Schlüssel —
guardrail_idgesetzt auf ein strengeresenterprise-pii-Guardrail (PII-block, nicht mask, auf Input;output-Stage-Secrets-Block), einefirewall_policy_idmit einer engeren Tool-Allowlist, eine höhere Credit-Obergrenze undallow_ips, festgepinnt auf ihr Backend.
/v1/chat/completions-Endpunkt mit ihrem eigenen
Schlüssel auf. Das Gateway löst die richtige Policy pro Schlüssel auf — Ihr
Anwendungscode ist für jeden Mandanten identisch.
6. Pro-Mandant-Compliance & -Residency
Ein regulierter Mandant braucht oft eine Attestierung, die der Rest nicht braucht. Compliance läuft als Workspace-Peer von Guardrails und Firewall:- Das Durchsuchen des Framework-Katalogs und der Readiness ist für jedes
Mitglied offen und kostenlos — bestätigen Sie die Abdeckung für das
Framework, nach dem ein Mandant fragt (
soc2,hipaa,gdpr,iso_27001,pci_dssund mehr). - Das Installieren eines Packs (
POST /api/compliance/packs/:key/install) materialisiert die passenden Guardrails und Firewall-Policies in Ihren Workspace; es erfordert Workspace-Admin und einen kostenpflichtigen Plan. - Datenresidenz pinnt die Region Ihres Compliance-Report-Artefakts
(
us/eu/uk/ap/cn/global) überPUT /api/compliance/residency(Admin). Cross-Region-Lesungen werden zurückgehalten.
Residency steuert hier das Compliance-Report-Artefakt, nicht das
Geo-Pinning von Inferenzdaten. Zur Request-Log-Geschichte: Logs werden für
einen Default von 30 Tagen aufbewahrt (hart begrenzt auf 180), und eine
Nutzer-Selbstlöschung läuft 30 Tage Grace, dann ein PII-Scrub, der zu den
Guardrail-Matches und Request-Logs dieses Nutzers kaskadiert.
7. Jeden Mandanten aus einem Workspace beobachten
Alle Observability ist workspace-bezogen, sodass ein Satz von Feeds alle Ihre Mandanten abdeckt — filterbar bis auf einen einzelnen:- Guardrails → Matches (jedes Mitglied) — jede Regel, die über alle Mandanten feuerte: Typ, Aktion, Stage, Detail. Der gematchte Teilstring wird nur aufgezeichnet, wenn Log raw content für dieses Guardrail an ist (per Default aus — die datenschutzkonservative Haltung, die in der Mandantenfähigkeit am meisten zählt). Markieren Sie ein False Positive zum Tunen (Admin).
- Firewall → Events / Runs (Developer+) — jeder Tool-Call, aufgerollt pro Agentenlauf, sodass die Schleife eines lärmenden Mandanten oder ein neuartiger Egress heraussticht.
- Anomalie-Feed (Member) — Raten-/Kosten-Spikes, bewertet gegen eine gelernte Hour-of-week-Baseline, fangen einen Mandanten, der außerhalb des Musters verbrennt, selbst wenn jeder Aufruf einzeln erlaubt ist.
guardrail_blocked /
firewall_blocked) zurück, kostet diesen Mandanten kein Kontingent und ist
als skip-retry markiert — die Grenze hielt, ohne den Mandanten für die
Ablehnung zu berechnen.
8. Wo es tiefer geht
Schlüssel, Policies, Workspaces eingrenzen
Die vollständige Auflösungsreihenfolge für Schlüsselbindung und
Workspace-Defaults.
Guardrails-Referenz
Jeder Regeltyp, jede PII-Entität und jeder Pro-Entitäts-Override in Gänze.
Firewall-Referenz
Verdikte, Surfaces, Autonomie-Level und die Policy-Ebene.
Datenexfiltration stoppen
Den ausgehenden Egress eines Mandanten-Agenten eingrenzen.
