La biblioteca de plantillas de guardrail de IA de OrcaRouter: elige un preset de la categoría PII, secrets, compliance, brand, safety, cost o agent, aplícalo como semilla, luego edita cada regla libremente antes de vincular una clave.
Quieres una política de contenido en su lugar rápido, sin escribir a mano regexes
ni listas de entidades PII. La biblioteca de plantillas es el atajo: un
conjunto de presets de guardrail listos para usar, agrupados por caso de uso, que
cada uno crea una política funcional en un clic. Elige uno, nómbralo, y tienes un
conjunto de reglas ordenado completo que puedes vincular a una clave — o editar
primero.Este es un aterrizaje enfocado para el caso de uso de presets. Para el motor de
guardrails completo — cada tipo de regla, campo, acción y ruta — ver la
referencia de Guardrails.
1. Qué te da la biblioteca de plantillas de guardrail de IA
Un preset es un punto de partida nombrado que deja caer un Policy completo
(una o más reglas ordenadas) en el modal de creación. Los presets se crean del
lado del servidor, así que el selector de la consola, el
sandbox de Test y estos docs describen
todos exactamente el mismo comportamiento — hay una única fuente de verdad.Cada preset es una semilla, no un candado. Una vez que aplicas uno, tú eres
dueño de la copia: renómbralo, añade o elimina reglas, cambia la
acción o la
etapa de una regla, reafina un detector.
Nada del template original restringe tus ediciones.
Aplicar un preset, como toda autoría de guardrails, es una acción de consola
bajo tu propia sesión de espacio de trabajo, y crear o editar un guardrail
requiere Developer+ en el espacio de trabajo. Solo la llamada final de relay
/v1/* usa una clave sk-orca-....
El selector agrupa los presets en ocho categorías. Cada una mapea a un control
común que de otro modo construirías a mano:
PII — redacta o bloquea datos personales
Detecta y enmascara (o bloquea) emails, teléfonos, SSNs, tarjetas, IPs y más.
Empieza con PII Shield para enmascarado
de una regla, o un bloqueador estricto cuando la PII nunca debe llegar al
proveedor.
Secrets — mantén credenciales fuera de los prompts
Bloquea claves de AWS / OpenAI / GitHub, claves privadas PEM, tokens de nube y
direcciones de monedero cripto antes de que salgan del gateway. Ver
Bloquear secretos.
Compliance — rieles de datos regulados
Bloqueos de tarjetas PCI, bloqueos de identificadores UE/RU, bloqueos de
identificadores sanitarios, y un
registrador de cumplimiento
solo-observar que registra ocurrencias de PII sin cambiar el tráfico.
Brand — denylists y seguridad de marca
Denylists de keywords para profanidad, menciones a competidores y términos
prohibidos específicos de región — block o mask. Ver
Seguridad de marca y
Palabras sensibles.
Safety — inyección, jailbreak, autolesiones
Rieles keyword/regex para frases de inyección de prompts, patrones de jailbreak
/ role-play, detección de fuga de prompt de sistema y denylists de
autolesiones. Ver
Inyección de prompts.
Cost — topes de tamaño y longitud
Topes max_chars en el prompt de la solicitud y la respuesta del modelo para
acotar coste y latencia. Ver
Guardrails de coste.
Agent — filtros de contenido agéntico
Filtros de URL, bloqueos de imagen markdown (defensa de exfil de imagen),
patrones de inyección de shell y filtros de inyección SQL en la salida para
flujos de agente. Ver
Guardrails agénticos.
Bloqueos de asignación de .env / secret-file, flags de licencia de copyleft
fuerte (GPL / AGPL / LGPL / SSPL) en solicitudes y salida del modelo, y un
aviso no bloqueante que anota prompts que referencian sinks de alto riesgo
(eval, os.system, pickle.loads). Ver
Seguridad de código.
Los presets solo crean los tipos de regla deterministas — keyword, regex, PII
y max-chars. Los tipos de regla avanzados (proveedor externo,
LLM judge, contextual grounding) se añaden
desde el constructor de reglas, no desde un template, porque necesitan una
conexión o un modelo que tú eliges.
Cada paso aquí es una acción de consola. La clave de relay aparece solo en la
solicitud final.
1
Abre el selector de plantillas
En la consola, abre Guardrails y haz clic en el botón dividido New
guardrail. El selector se abre agrupado por las ocho categorías de arriba.
2
Elige un preset
Elige uno — p. ej. PII Shield de la categoría PII. Crea una política
completa (aquí, una sola regla pii de enmascarado). El selector muestra la
descripción de cada preset para que sepas qué hace antes de aplicarlo.
3
Nómbralo y edita libremente
Dale un nombre (≤ 64 caracteres). Las reglas creadas ahora son tuyas — añade,
elimina o reafina cualquiera de ellas. Un preset es una semilla, no un candado.
4
Prueba antes de vincular
Abre la pestaña Test, pega una muestra, elige una etapa y ejecuta la
política localmente — sin llamada upstream, sin cuota. Prueba que hace lo que
esperas antes de que cualquier clave la apunte.
5
Vincula una clave
Edita una clave API y elige el guardrail del desplegable Guardrail
(establece guardrail_id en la clave), o márcalo como valor por defecto
del espacio de trabajo. Ver
Vincular a una clave y
Valor por defecto de cuenta.
Esa es una política de enmascarado usable de fábrica. Pero como el preset es una
semilla, puedes ajustarla inmediatamente — por ejemplo, cambiar dos entidades a
block con una sobrescritura por entidad para que las tarjetas y SSNs se
rechacen directamente mientras el resto se enmascara:
El gateway enmascara el email a [EMAIL] antes de reenviar. Una solicitud que
lleva un número de tarjeta es rechazada con HTTP 400guardrail_blocked — que
no cuesta cuota (un bloqueo de entrada se dispara antes de la medición) y se
marca como skip-retry. Ver el
error guardrail_blocked.
El preset PII Shield crea una regla de enmascarado de etapa both, pero el
enmascarado en vivo de la salida del modelo y de respuestas con streaming está
en el roadmap — el enmascarado en la etapa de entrada es la ruta activa (el
gateway limpia la solicitud antes de que el modelo la vea). Para vetar las
respuestas del modelo hoy, una regla block de salida se aplica con y sin
streaming. Ver
Reglas de la etapa de salida y
Cobertura de streaming.
Cada create, update y delete en un guardrail — incluido el momento en que aplicas
un preset y guardas — escribe una fila de historial versionada. Puedes hacer
diff de dos versiones cualesquiera y revertir a una anterior, así que
editar una política creada nunca es una puerta de un solo sentido. Ver
Versionado.
El preset de enmascarado de PII de un clic, de principio a fin.
Bloquear secretos
El preset Secrets Blocker — captura claves y credenciales en la solicitud.
Guardrails agénticos
Filtros de URL, imagen markdown, shell y SQL para flujos de agente.
Referencia de Guardrails
El motor completo — cada tipo de regla, campo y ruta.
Los presets crean políticas de contenido. Para gobernar las llamadas a
herramienta de un agente — denegar acciones destructivas, redactar argumentos de
llamada a herramienta, requerir aprobación — empieza con el
Firewall y
Asegurar agentes de IA. Para cómo las
dos capas dividen el trabajo, ver
Guardrails vs. Firewall.