Saltar al contenido principal
Quieres mantener los datos personales fuera del modelo upstream. Un cliente pega una dirección de email, una transcripción de soporte lleva un número de tarjeta, un prompt de agente filtra un SSN — y nada de eso debería llegar a OpenAI, Anthropic o Google en claro. PII Shield es la forma más rápida de arreglarlo: un preset de guardrail de una sola regla que detecta entidades sensibles en la solicitud y enmascara cada una a una etiqueta tipada antes de que el gateway reenvíe la llamada. Este es un aterrizaje enfocado para el caso de uso de enmascarado de PII. Para el motor de guardrails completo — cada tipo de regla, campo y ruta — ver la referencia de Guardrails.

1. El caso de uso de redacción de PII en LLM en una regla

La parte difícil de la fontanería de redacción de pii llm suele ser la fontanería. PII Shield la elimina. El preset es una sola regla pii:
  • Tipo: PII detection (pii)
  • Acción: Mask — reemplaza cada coincidencia con una etiqueta tipada
  • Entidades: email, phone, ssn, credit_card, ip
Aplícalo una vez en la consola, vincúlalo a una clave, y cada llamada en esa clave se examina sin cambio de SDK y sin redespliegue. La política vive en el gateway, no en tu aplicación — tu app sigue llamando a /v1/chat/completions exactamente como antes.
El enmascarado en la etapa de entrada es la ruta activa. PII Shield enmascara la solicitud antes de que salga del gateway, así que el modelo upstream nunca ve el valor original. El enmascarado en vivo de la salida del modelo y de respuestas con streaming está en el roadmap; encuadra PII Shield como limpiar lo que envías, no lo que regresa. Para vetar las respuestas del modelo hoy, una regla block de salida se aplica en ambos sentidos — ver Reglas de la etapa de salida y Cobertura de streaming.

2. Aplica el preset en la consola

Cada paso aquí es una acción de consola sobre el gateway alojado bajo tu propia sesión. Crear y editar guardrails requiere Developer+ en el espacio de trabajo. Solo la llamada final /v1/* usa una clave de relay sk-orca-....
1

Abre la plantilla

En la consola, abre Guardrails, haz clic en el botón dividido New guardrail y elige PII Shield de la categoría de plantillas PII. Crea una sola regla pii de enmascarado.
2

Nombra y guarda

Dale un nombre (≤ 64 caracteres), p. ej. pii-shield, y guarda. Un preset es una semilla, no un candado — edita la lista de entidades o la acción libremente después.
3

Pruébalo

Abre la pestaña Test, pega una muestra en la etapa input y ejecuta la política localmente — sin llamada upstream, sin cuota (ver §4).
4

Vincula una clave

Edita una clave API y elige pii-shield del desplegable Guardrail (establece guardrail_id en la clave), o márcalo como valor por defecto del espacio de trabajo. Ver Vincular a una clave y Valor por defecto de cuenta.

3. Qué se enmascara, y a qué

En una acción mask cada coincidencia se reemplaza con una etiqueta tipada — un email se convierte en [EMAIL], un SSN se convierte en [SSN]. El conjunto de detectores integrados es cerrado y compartido por el motor, el sandbox y el constructor de reglas:
email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.
jp_mynumber (My Number de Japón → [JP_MYNUMBER]), kr_rrn (RRN de Corea → [KR_RRN]) y cn_resident_id (ID de residente de China → [CN_RESIDENT_ID]). Habilita los que coincidan con tu jurisdicción.
Superpón un detector regex sobre los integrados — un employee_id, un número de cuenta interno — con un checksum luhn opcional y un reemplazo personalizado. Hasta 25 por regla. Ver Entidades PII personalizadas y Formatos de enmascarado.
Una regla PII puede aplicar diferentes acciones a diferentes entidades vía entity_actions — enmascarar email / phone / ip, pero bloquear en credit_card o ssn. Sin necesidad de reglas solapadas. Ver Acciones.

4. Prueba antes de vincular

Prueba que la regla hace lo que esperas antes de que cualquier clave la apunte. Abre la pestaña Test dentro del editor, pega una muestra, elige la etapa input y ejecuta:
Reply to jane@acme.com please
El sandbox evalúa la política actual localmente y devuelve el veredicto más el texto renderizado — nada se envía upstream, nada se mide:
Reply to [EMAIL] please
Para una rejilla A/B contra un corpus, el arnés de Eval vive una pestaña al lado.

5. Envía una solicitud

Usando una clave vinculada a pii-shield, llama a OrcaRouter exactamente como antes — sin nuevas cabeceras, sin cambio de SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
El gateway enmascara el email a [EMAIL] antes de reenviar — el modelo upstream recibe Reply to [EMAIL] please y nunca ve la dirección.
Cambia la acción de una entidad a block (vía sobrescritura por entidad) y la siguiente solicitud que lleve esa entidad es rechazada con HTTP 400 guardrail_blocked. Una solicitud bloqueada no cuesta cuota (un bloqueo de entrada se dispara antes de la medición) y se marca como skip-retry. Ver el error guardrail_blocked.

6. Ve qué se disparó

Cada regla que se dispara registra una coincidencia — tipo de regla, acción, etapa y una cadena de detalle — que aparece en el feed Matches del espacio de trabajo. La propia subcadena coincidente (la dirección de email real) se registra solo cuando Log raw content está activado, que está apagado por defecto — la postura conservadora con la privacidad que mantiene la PII redactada fuera de tu propia telemetría también.
Para un control de redacción, dejar Log raw content apagado suele ser el punto: llegas a ver que un email fue enmascarado y con qué frecuencia, sin re-capturar el valor que acabas de limpiar. Actívalo por guardrail solo cuando necesites la subcadena para triaje; el ajuste no es retroactivo. Ver Feed de coincidencias y Registro y privacidad.

7. Dónde ir a continuación

Entidades PII personalizadas

Añade tus propios detectores regex con verificaciones Luhn opcionales, hasta 25 por regla.

Formatos de enmascarado

Controla la etiqueta tipada a la que se renderiza cada entidad.

Bloquear secretos

Captura claves API y credenciales con el preset Secrets Blocker.

Afinar falsos positivos

Marca falsos positivos y ajusta detectores desde el feed de Matches.
PII Shield enmascara contenido. Para gobernar las llamadas a herramienta de un agente — denegar acciones destructivas, redactar argumentos de llamada a herramienta, requerir aprobación — usa el Firewall. Empieza con Asegurar agentes de IA y la amenaza de exfiltración de datos, o lee la referencia de Guardrails para el motor completo.