Template-Bibliothek und Presets

Sie wollen schnell eine Content-Policy in Stellung bringen, ohne Regexes oder PII-Entity-Listen von Hand zu schreiben. Die Template-Bibliothek ist die Abkürzung: eine Reihe fertiger Guardrail-Presets, gruppiert nach Anwendungsfall, die jeweils mit einem Klick eine funktionierende Policy befüllen. Wählen Sie eines, benennen Sie es, und Sie haben ein vollständiges geordnetes Regelset, das Sie an einen Key anhängen können — oder zuerst bearbeiten. Dies ist eine fokussierte Landingpage für den Preset-Anwendungsfall. Die vollständige Guardrail-Engine — jeder Regeltyp, jedes Feld, jede Action und jede Route — finden Sie in der Guardrails-Referenz.

1. Was Ihnen die KI-Guardrail-Templates-Bibliothek gibt

Ein Preset ist ein benannter Ausgangspunkt, der eine vollständige Policy (eine oder mehrere geordnete Regeln) in das Erstell-Modal fallen lässt. Die Presets werden serverseitig verfasst, sodass der Konsolen-Picker, die Test-Sandbox und diese Dokumentation alle exakt dasselbe Verhalten beschreiben — es gibt eine einzige Quelle der Wahrheit. Jedes Preset ist ein Seed, kein Schloss. Sobald Sie eines anwenden, besitzen Sie die Kopie: umbenennen, Regeln hinzufügen oder löschen, die Action oder Stage einer Regel ändern, einen Detektor neu justieren. Nichts am ursprünglichen Template schränkt Ihre Bearbeitungen ein.

Das Anwenden eines Presets ist, wie alles Guardrail-Verfassen, eine Konsolen-Aktion in Ihrer eigenen Workspace-Session, und das Erstellen oder Bearbeiten eines Guardrails erfordert Developer+ im Workspace. Nur der finale /v1/*-Relay-Aufruf nutzt einen sk-orca-...-Key.

2. Preset-Kategorien

Der Picker gruppiert Presets in acht Kategorien. Jede bildet eine übliche Kontrolle ab, die Sie sonst von Hand bauen würden:

PII — persönliche Daten redigieren oder blockieren

Erkennen und maskieren (oder blockieren) Sie E-Mails, Telefonnummern, SSNs, Karten, IPs und mehr. Beginnen Sie mit PII Shield für Ein-Regel-Maskierung oder einem strengen Blocker, wenn PII nie den Anbieter erreichen darf.

Secrets — Anmeldedaten aus Prompts heraushalten

Blockieren Sie AWS- / OpenAI- / GitHub-Keys, PEM-Private-Keys, Cloud-Tokens und Krypto-Wallet-Adressen, bevor sie das Gateway verlassen. Siehe Secrets blockieren.

Compliance — Schienen für regulierte Daten

PCI-Kartenblöcke, EU-/UK-Identifier-Blöcke, Healthcare-Identifier-Blöcke und ein nur-beobachtender Compliance-Logger, der PII-Vorkommen aufzeichnet, ohne den Traffic zu ändern.

Brand — Denylists und Markensicherheit

Keyword-Denylists für Schimpfwörter, Wettbewerber-Erwähnungen und regionsspezifische verbotene Begriffe — blockieren oder maskieren. Siehe Markensicherheit und Sensible Wörter.

Safety — Injection, Jailbreak, Selbstverletzung

Keyword-/Regex-Schienen für Prompt-Injection-Phrasen, Jailbreak-/ Role-Play-Muster, System-Prompt-Leak-Erkennung und Selbstverletzungs-Denylists. Siehe Prompt-Injection.

Cost — Größen- und Längenlimits

max_chars-Limits auf dem Request-Prompt und der Modell-Response, um Kosten und Latenz zu begrenzen. Siehe Kosten-Guardrails.

Agent — agentische Content-Filter

URL-Filter, Markdown-Bild-Blöcke (Bild-Exfil-Verteidigung), Shell-Injection-Muster und SQL-Injection-im-Output-Filter für Agent-Flows. Siehe Agentische Guardrails.

Code-Security — Secrets, Lizenzen, risikoreiche APIs

.env- / Secret-File-Zuweisungsblöcke, Strong-Copyleft-Lizenz-Flags (GPL / AGPL / LGPL / SSPL) auf Requests und Modell-Output sowie ein nicht-blockierender Hinweis, der Prompts annotiert, die risikoreiche Senken referenzieren (eval, os.system, pickle.loads). Siehe Code-Security.

Presets befüllen nur die deterministischen Regeltypen — keyword, regex, PII und max-chars. Die erweiterten Regeltypen (externer Anbieter, LLM-Judge, kontextuelle Verankerung) werden aus dem Regel-Builder hinzugefügt, nicht aus einem Template, weil sie eine Verbindung oder ein Modell brauchen, das Sie wählen.

3. Ein Preset als Seed anwenden

Jeder Schritt hier ist eine Konsolen-Aktion. Der Relay-Key taucht nur im finalen Request auf.

Den Template-Picker öffnen

Öffnen Sie in der Konsole Guardrails und klicken Sie auf den New guardrail-Split-Button. Der Picker öffnet sich gruppiert nach den acht obigen Kategorien.

Ein Preset wählen

Wählen Sie eines — z. B. PII Shield aus der Kategorie PII. Es befüllt eine vollständige Policy (hier eine einzelne maskierende pii-Regel). Der Picker zeigt die Beschreibung jedes Presets, sodass Sie wissen, was es tut, bevor Sie es anwenden.

Benennen und frei bearbeiten

Geben Sie ihm einen Namen (≤ 64 Zeichen). Die befüllten Regeln gehören nun Ihnen — fügen Sie eine beliebige hinzu, löschen oder justieren Sie sie neu. Ein Preset ist ein Seed, kein Schloss.

Testen, bevor Sie anhängen

Öffnen Sie den Tab Test, fügen Sie ein Beispiel ein, wählen Sie eine Stage und führen Sie die Policy lokal aus — kein Upstream-Aufruf, kein Kontingent. Beweisen Sie, dass sie tut, was Sie erwarten, bevor irgendein Key darauf zeigt.

Einen Key anhängen

Bearbeiten Sie einen API-Key und wählen Sie das Guardrail aus dem Dropdown Guardrail (setzt guardrail_id am Key), oder markieren Sie es als Workspace-Default. Siehe An einen Key anhängen und Account-Default.

4. Ein konkretes Beispiel: befüllen, dann durchsetzen

Wenden Sie das Preset PII Shield an. Es befüllt genau eine Regel:

{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}

Das ist out of the box eine nutzbare Maskierungs-Policy. Aber weil das Preset ein Seed ist, können Sie es sofort verschärfen — tauschen Sie zum Beispiel zwei Entities per Pro-Entity-Override auf block, sodass Karten und SSNs rundheraus abgelehnt werden, während der Rest maskiert wird:

{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}

Speichern Sie, hängen Sie es an einen Key an und rufen Sie das Gateway genau wie zuvor auf — keine SDK-Änderung, kein Redeploy:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

Das Gateway maskiert die E-Mail zu [EMAIL], bevor es weiterleitet. Ein Request, der eine Kartennummer trägt, wird mit HTTP 400 guardrail_blocked abgelehnt — was kein Kontingent kostet (ein Input-Block feuert vor der Messung) und als skip-retry markiert wird. Siehe den guardrail_blocked-Fehler.

Das Preset PII Shield befüllt eine both-Stage-Maskierungsregel, aber die Live-Maskierung von Modell-Output und gestreamten Responses ist auf der Roadmap — Input-Stage-Maskierung ist der Live-Pfad (das Gateway bereinigt den Request, bevor das Modell ihn sieht). Um Modell-Responses heute zu steuern, wird eine Output-block-Regel sowohl streaming als auch nicht-streaming durchgesetzt. Siehe Output-Stage-Regeln und Streaming-Abdeckung.

5. Nach dem Anwenden — der Rest ist die Engine

Ein Preset ist nur ein schneller Weg, Regeln zu verfassen. Alles Nachgelagerte ist die normale Guardrail-Engine:

Sie bekommen	Wo
Pro-Regel-Actions	Actions
Test + Eval	Testing & Eval
Was ausgelöst hat	Matches-Feed
Eine Änderung zurückrollen	Versionierung

Jedes Create, Update und Delete an einem Guardrail — einschließlich des Moments, in dem Sie ein Preset anwenden und speichern — schreibt eine versionierte History-Zeile. Sie können zwei beliebige Versionen diffen und zu einer früheren zurückkehren, sodass das Bearbeiten einer befüllten Policy nie eine Einbahntür ist. Siehe Versionierung.

6. Wie es weitergeht

PII Shield

Das Ein-Klick-PII-Maskierungs-Preset, von Anfang bis Ende.

Secrets blockieren

Das Secrets-Blocker-Preset — fangen Sie Keys und Anmeldedaten im Request.

Agentische Guardrails

URL-, Markdown-Bild-, Shell- und SQL-Filter für Agent-Flows.

Guardrails-Referenz

Die vollständige Engine — jeder Regeltyp, jedes Feld und jede Route.

Presets befüllen Content-Policies. Um die Tool-Calls eines Agenten zu steuern — destruktive Aktionen verweigern, Tool-Call-Argumente redigieren, Freigabe verlangen — beginnen Sie mit der Firewall und KI-Agenten absichern. Wie die beiden Ebenen die Arbeit aufteilen, finden Sie unter Guardrails vs. Firewall.

​1. Was Ihnen die KI-Guardrail-Templates-Bibliothek gibt

​2. Preset-Kategorien

​3. Ein Preset als Seed anwenden

​4. Ein konkretes Beispiel: befüllen, dann durchsetzen

​5. Nach dem Anwenden — der Rest ist die Engine

​6. Wie es weitergeht

PII Shield

Secrets blockieren

Agentische Guardrails

Guardrails-Referenz

1. Was Ihnen die KI-Guardrail-Templates-Bibliothek gibt

2. Preset-Kategorien

3. Ein Preset als Seed anwenden

4. Ein konkretes Beispiel: befüllen, dann durchsetzen

5. Nach dem Anwenden — der Rest ist die Engine

6. Wie es weitergeht