Cada paso aquí es una acción de consola sobre el gateway alojado
(
api.orcarouter.ai). La configuración de guardrails se ejecuta bajo tu
propia sesión; solo la llamada final /v1/* usa una clave de relay
sk-orca-.... Crear y editar guardrails requiere Developer+ en el espacio
de trabajo.1. Cómo añadir guardrails de LLM en cinco pasos
Aquí está todo el ciclo de un vistazo — cada paso se expande abajo.Crear un guardrail
En la consola, abre Guardrails y haz clic en New guardrail. Dale
un nombre (≤ 64 caracteres), p. ej.
pii-shield.Probarlo en el sandbox
Abre la pestaña Test, pega una muestra y ejecuta la política
localmente — sin llamada upstream, sin cuota.
Vincularlo a una clave
Edita una clave API y elige el guardrail del desplegable Guardrail.
La vinculación vive en la clave.
2. Crea el guardrail
En la consola, abre Guardrails y haz clic en New guardrail. Un guardrail es una política de contenido nombrada, con alcance de espacio de trabajo — una lista ordenada de reglas que el gateway ejecuta contra la entrada de la solicitud y la salida del modelo. Nómbralopii-shield y
guarda.
3. Añade una regla
Cada regla decide tres cosas — qué buscar (un tipo de regla), dónde buscar (una etapa) y qué hacer (una acción). Añade una regla:- Tipo: PII detection (
pii) - Etapa: Input (la solicitud)
- Acción: Mask — redactar la coincidencia
- Entidades:
email,phone,ssn
[EMAIL], un SSN se convierte en [SSN]. Los
siete tipos de regla (keyword, regex, pii, max_chars, external,
llm_judge, grounding) y las cinco acciones (block, mask, flag,
annotate, spotlight) se cubren en la
referencia. Para este primer
guardrail, una regla de enmascarado es suficiente.
El enmascarado está activo en ambas etapas. Las reglas de la etapa de
entrada enmascaran la solicitud antes de que el modelo la vea; las reglas de
la etapa de salida enmascaran la respuesta del modelo — en respuestas sin
streaming y chunk a chunk en las de streaming — antes de que el cliente la
reciba. Block se aplica también en ambas etapas. Si quieres vetar las
respuestas del modelo, establece la etapa de la regla en
output (o
both); ver
Reglas de la etapa de salida.4. Pruébalo en el sandbox
Antes de vincular el guardrail a cualquier clave, prueba que hace lo que esperas. Abre la pestaña Test dentro del editor, pega una muestra, elige la etapainput y ejecuta:
5. Vincúlalo a una clave
Un guardrail no hace nada hasta que una clave lo apunta. Dos formas de vincular:Por clave
Edita una clave API y elige el guardrail del desplegable Guardrail.
Esto establece
guardrail_id en la clave. Ver
Vincular a una clave.Valor por defecto del espacio de trabajo
Marca el guardrail como el valor por defecto del espacio de trabajo
para que cualquier clave sin vinculación explícita lo herede. Ver
Valor por defecto de cuenta.
| Orden | Qué aplica |
|---|---|
| 1 | El guardrail_id explícito de la clave (si existe y está habilitado). |
| 2 | El valor por defecto del espacio de trabajo (si la clave no tiene vinculación). |
| 3 | Ninguno — la solicitud es idéntica byte a byte a un espacio de trabajo sin política. |
6. Envía una solicitud
Usando una clave vinculada apii-shield, llama a OrcaRouter exactamente como
antes — sin cambio de SDK, sin nuevas cabeceras:
[EMAIL] antes de reenviar — el modelo
upstream nunca ve la dirección. Cambia la acción de la regla a block y la
siguiente solicitud que contenga la entidad es rechazada con HTTP 400
guardrail_blocked. Una solicitud bloqueada no cuesta cuota (un bloqueo
de entrada se dispara antes de la medición; un bloqueo de salida reembolsa la
cuota preconsumida) y se marca como skip-retry. Ver el
error guardrail_blocked
para la forma completa de la respuesta.
7. Dónde ir a continuación
Ve qué se disparó
Ve qué se disparó
Cada regla que se dispara registra una coincidencia — tipo, acción,
etapa y una cadena de detalle. La subcadena coincidente se registra solo
cuando Log raw content está activado (apagado por defecto). Ver el
Feed de coincidencias y
Registro y privacidad.
Enmascara más que lo básico
Enmascara más que lo básico
PII detection cubre
email, phone, credit_card, ssn, ip,
iban, mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address (más entidades regionales), y puedes crear las tuyas
propias. Ver PII Shield,
Entidades PII personalizadas y
Formatos de enmascarado.Captura secretos e inyección
Captura secretos e inyección
Añade un Bloqueador de secretos o
el preset Básicos de inyección de prompts
— este último marca frases comunes de jailbreak para revisión. Para
capturar la intención de inyección de forma semántica en vez de por
frase, añade una regla
llm_judge
junto a él.Revierte un cambio
Revierte un cambio
Cada edición escribe una fila de historial de versiones. Abre History
para hacer diff y revertir. Ver
Versionado.
Veta llamadas a herramienta, no solo texto
Veta llamadas a herramienta, no solo texto
Los guardrails examinan contenido. Para gobernar las llamadas a
herramienta de un agente — denegar acciones destructivas, topar coste,
requerir aprobación — usa el Firewall. Empieza con
Asegurar agentes de IA y la
amenaza de llamadas a herramienta peligrosas.
