Die OrcaRouter-KI-Guardrail-Templates-Bibliothek: Wählen Sie ein Preset aus der Kategorie PII, Secrets, Compliance, Brand, Safety, Cost oder Agent, wenden Sie es als Seed an und bearbeiten Sie dann jede Regel frei, bevor Sie einen Key anhängen.
Sie wollen schnell eine Content-Policy in Stellung bringen, ohne Regexes
oder PII-Entity-Listen von Hand zu schreiben. Die Template-Bibliothek
ist die Abkürzung: eine Reihe fertiger Guardrail-Presets, gruppiert nach
Anwendungsfall, die jeweils mit einem Klick eine funktionierende Policy
befüllen. Wählen Sie eines, benennen Sie es, und Sie haben ein
vollständiges geordnetes Regelset, das Sie an einen Key anhängen können —
oder zuerst bearbeiten.Dies ist eine fokussierte Landingpage für den Preset-Anwendungsfall. Die
vollständige Guardrail-Engine — jeder Regeltyp, jedes Feld, jede Action und
jede Route — finden Sie in der
Guardrails-Referenz.
1. Was Ihnen die KI-Guardrail-Templates-Bibliothek gibt
Ein Preset ist ein benannter Ausgangspunkt, der eine vollständige
Policy (eine oder mehrere geordnete Regeln) in das Erstell-Modal fallen
lässt. Die Presets werden serverseitig verfasst, sodass der Konsolen-Picker,
die Test-Sandbox und diese
Dokumentation alle exakt dasselbe Verhalten beschreiben — es gibt eine
einzige Quelle der Wahrheit.Jedes Preset ist ein Seed, kein Schloss. Sobald Sie eines anwenden,
besitzen Sie die Kopie: umbenennen, Regeln hinzufügen oder löschen, die
Action oder
Stage einer Regel ändern, einen
Detektor neu justieren. Nichts am ursprünglichen Template schränkt Ihre
Bearbeitungen ein.
Das Anwenden eines Presets ist, wie alles Guardrail-Verfassen, eine
Konsolen-Aktion in Ihrer eigenen Workspace-Session, und das Erstellen
oder Bearbeiten eines Guardrails erfordert Developer+ im Workspace. Nur
der finale /v1/*-Relay-Aufruf nutzt einen sk-orca-...-Key.
Der Picker gruppiert Presets in acht Kategorien. Jede bildet eine übliche
Kontrolle ab, die Sie sonst von Hand bauen würden:
PII — persönliche Daten redigieren oder blockieren
Erkennen und maskieren (oder blockieren) Sie E-Mails, Telefonnummern,
SSNs, Karten, IPs und mehr. Beginnen Sie mit
PII Shield für Ein-Regel-Maskierung
oder einem strengen Blocker, wenn PII nie den Anbieter erreichen darf.
Secrets — Anmeldedaten aus Prompts heraushalten
Blockieren Sie AWS- / OpenAI- / GitHub-Keys, PEM-Private-Keys,
Cloud-Tokens und Krypto-Wallet-Adressen, bevor sie das Gateway
verlassen. Siehe Secrets blockieren.
Compliance — Schienen für regulierte Daten
PCI-Kartenblöcke, EU-/UK-Identifier-Blöcke,
Healthcare-Identifier-Blöcke und ein nur-beobachtender
Compliance-Logger, der
PII-Vorkommen aufzeichnet, ohne den Traffic zu ändern.
Brand — Denylists und Markensicherheit
Keyword-Denylists für Schimpfwörter, Wettbewerber-Erwähnungen und
regionsspezifische verbotene Begriffe — blockieren oder maskieren. Siehe
Markensicherheit und
Sensible Wörter.
Safety — Injection, Jailbreak, Selbstverletzung
Keyword-/Regex-Schienen für Prompt-Injection-Phrasen, Jailbreak-/
Role-Play-Muster, System-Prompt-Leak-Erkennung und
Selbstverletzungs-Denylists. Siehe
Prompt-Injection.
Cost — Größen- und Längenlimits
max_chars-Limits auf dem Request-Prompt und der Modell-Response, um
Kosten und Latenz zu begrenzen. Siehe
Kosten-Guardrails.
Agent — agentische Content-Filter
URL-Filter, Markdown-Bild-Blöcke (Bild-Exfil-Verteidigung),
Shell-Injection-Muster und SQL-Injection-im-Output-Filter für
Agent-Flows. Siehe
Agentische Guardrails.
.env- / Secret-File-Zuweisungsblöcke, Strong-Copyleft-Lizenz-Flags
(GPL / AGPL / LGPL / SSPL) auf Requests und Modell-Output sowie ein
nicht-blockierender Hinweis, der Prompts annotiert, die risikoreiche
Senken referenzieren (eval, os.system, pickle.loads). Siehe
Code-Security.
Presets befüllen nur die deterministischen Regeltypen — keyword, regex,
PII und max-chars. Die erweiterten Regeltypen (externer Anbieter,
LLM-Judge, kontextuelle Verankerung)
werden aus dem Regel-Builder hinzugefügt, nicht aus einem Template, weil sie
eine Verbindung oder ein Modell brauchen, das Sie wählen.
Jeder Schritt hier ist eine Konsolen-Aktion. Der Relay-Key taucht nur
im finalen Request auf.
1
Den Template-Picker öffnen
Öffnen Sie in der Konsole Guardrails und klicken Sie auf den
New guardrail-Split-Button. Der Picker öffnet sich gruppiert nach
den acht obigen Kategorien.
2
Ein Preset wählen
Wählen Sie eines — z. B. PII Shield aus der Kategorie PII. Es
befüllt eine vollständige Policy (hier eine einzelne maskierende
pii-Regel). Der Picker zeigt die Beschreibung jedes Presets, sodass
Sie wissen, was es tut, bevor Sie es anwenden.
3
Benennen und frei bearbeiten
Geben Sie ihm einen Namen (≤ 64 Zeichen). Die befüllten Regeln gehören
nun Ihnen — fügen Sie eine beliebige hinzu, löschen oder justieren Sie
sie neu. Ein Preset ist ein Seed, kein Schloss.
4
Testen, bevor Sie anhängen
Öffnen Sie den Tab Test, fügen Sie ein Beispiel ein, wählen Sie eine
Stage und führen Sie die Policy lokal aus — kein Upstream-Aufruf, kein
Kontingent. Beweisen Sie, dass sie tut, was Sie erwarten, bevor
irgendein Key darauf zeigt.
5
Einen Key anhängen
Bearbeiten Sie einen API-Key und wählen Sie das Guardrail aus dem
Dropdown Guardrail (setzt guardrail_id am Key), oder markieren Sie
es als Workspace-Default. Siehe
An einen Key anhängen und
Account-Default.
Das ist out of the box eine nutzbare Maskierungs-Policy. Aber weil das
Preset ein Seed ist, können Sie es sofort verschärfen — tauschen Sie zum
Beispiel zwei Entities per Pro-Entity-Override auf block, sodass Karten
und SSNs rundheraus abgelehnt werden, während der Rest maskiert wird:
Das Gateway maskiert die E-Mail zu [EMAIL], bevor es weiterleitet. Ein
Request, der eine Kartennummer trägt, wird mit HTTP 400guardrail_blocked abgelehnt — was kein Kontingent kostet (ein
Input-Block feuert vor der Messung) und als skip-retry markiert wird.
Siehe den
guardrail_blocked-Fehler.
Das Preset PII Shield befüllt eine both-Stage-Maskierungsregel, aber
die Live-Maskierung von Modell-Output und gestreamten Responses ist auf
der Roadmap — Input-Stage-Maskierung ist der Live-Pfad (das Gateway
bereinigt den Request, bevor das Modell ihn sieht). Um Modell-Responses
heute zu steuern, wird eine Output-block-Regel sowohl streaming als auch
nicht-streaming durchgesetzt. Siehe
Output-Stage-Regeln und
Streaming-Abdeckung.
Jedes Create, Update und Delete an einem Guardrail — einschließlich des
Moments, in dem Sie ein Preset anwenden und speichern — schreibt eine
versionierte History-Zeile. Sie können zwei beliebige Versionen diffen
und zu einer früheren zurückkehren, sodass das Bearbeiten einer
befüllten Policy nie eine Einbahntür ist. Siehe
Versionierung.
Das Ein-Klick-PII-Maskierungs-Preset, von Anfang bis Ende.
Secrets blockieren
Das Secrets-Blocker-Preset — fangen Sie Keys und Anmeldedaten im
Request.
Agentische Guardrails
URL-, Markdown-Bild-, Shell- und SQL-Filter für Agent-Flows.
Guardrails-Referenz
Die vollständige Engine — jeder Regeltyp, jedes Feld und jede Route.
Presets befüllen Content-Policies. Um die Tool-Calls eines Agenten zu
steuern — destruktive Aktionen verweigern, Tool-Call-Argumente redigieren,
Freigabe verlangen — beginnen Sie mit der Firewall
und KI-Agenten absichern. Wie
die beiden Ebenen die Arbeit aufteilen, finden Sie unter
Guardrails vs. Firewall.