1. Registro de privacidad de guardrails: apagado por defecto
Cada guardrail lleva un solo toggle por política, Log raw content, y viene apagado. Con él apagado, una coincidencia registra los metadatos de lo que se disparó pero nunca copia el texto ofensivo al feed:Registrado con el toggle APAGADO
Tipo de regla, acción, etapa y una cadena de detalle corta — suficiente para
saber que una regla
pii enmascaró un email en la solicitud, sin almacenar
la dirección.Añadido solo cuando está ENCENDIDO
La(s) subcadena(s) coincidente(s) — el texto literal que la regla
capturó. Capturado solo para coincidencias registradas después de que
habilites el toggle.
Apagado por defecto es la postura conservadora con la privacidad. La
subcadena coincidente es lo más sensible que un guardrail podría registrar — es,
por definición, los datos que la regla existe para capturar. OrcaRouter no la
almacena a menos que optes por ello por guardrail.
2. Qué contiene un registro de coincidencia
Una coincidencia es un registro diagnóstico pequeño, con alcance de espacio de trabajo. Con Log raw content apagado, lleva solo metadatos:| Campo | Ejemplo | ¿Presente cuando el toggle está apagado? |
|---|---|---|
| Tipo de regla | pii, regex, keyword | Sí |
| Acción | block, mask, flag | Sí |
| Etapa | input, output | Sí |
| Detalle | cadena clasificadora corta (p. ej. la entidad) | Sí |
| Subcadena coincidente | jane@acme.com | Solo cuando está ENCENDIDO |
3. Un ejemplo concreto
Toma un guardrail con una reglapii que enmascara email en la solicitud,
vinculado a una clave. Un llamador envía:
[EMAIL] antes de que el modelo la vea, y una
coincidencia aterriza en el feed. Lo que esa coincidencia contiene depende
enteramente del toggle:
Log raw content APAGADO (por defecto)
Log raw content APAGADO (por defecto)
La coincidencia registra: tipo de regla
pii, acción mask, etapa input,
y una cadena de detalle que nombra la entidad email. No almacena
jane@acme.com. Sabes que un email fue enmascarado en la solicitud; no puedes
leer el email de vuelta del feed.Log raw content ENCENDIDO
Log raw content ENCENDIDO
La misma coincidencia lleva adicionalmente la subcadena coincidente —
jane@acme.com — para que puedas confirmar precisamente qué capturó la regla
durante una pasada de triaje.4. Activarlo (y la garantía no retroactiva)
Log raw content es un ajuste por guardrail. Editar un guardrail es una acción de consola bajo tu propia sesión y requiere Developer+ en el espacio de trabajo — solo la llamada final/v1/* usa una clave de relay sk-orca-....
Abre el guardrail
En la consola, abre Guardrails y edita la política para la que quieres
capturar subcadenas.
Habilita Log raw content
Activa el toggle Log raw content y guarda. Guardar escribe una fila de
historial versionada, así que el cambio es auditable y revertible — ver
Versionado.
5. Qué se captura cuando está encendido
Cuando Log raw content está encendido, el motor adjunta el texto coincidente literal a cada violación, con dos topes duros que evitan que una entrada patológica infle un solo registro de coincidencia:- A lo sumo 32 entradas coincidentes por violación.
- Cada entrada está topada en 256 caracteres.
Incluso con el toggle encendido, un guardrail solo registra texto que una regla
realmente coincidió. El prompt circundante y el resto de la respuesta nunca
se copian al feed de Matches. Los payloads completos de solicitud/respuesta son
una preocupación separada de los diagnósticos de guardrail.
6. Eliminar subcadenas que ya capturaste
Como el toggle no es retroactivo, apagarlo deja subcadenas previas en su lugar. Dos superficies las limpian:| Quieres eliminar | Cómo |
|---|---|
| Una coincidencia ruidosa | Márcala como falso positivo — POST /api/guardrail/match/:id/mark-fp (Admin del espacio de trabajo), o la acción Mark false positive en el feed. |
| Todas las coincidencias de guardrail de un usuario | Una auto-eliminación de usuario dispara una ventana de gracia de 30 días, luego un borrado de PII que cascada a través de coincidencias de guardrail, logs de solicitud y eventos de firewall. Ver Compliance. |
7. Quién puede leer qué
El feed de Matches es datos diagnósticos con alcance de espacio de trabajo. El acceso de lectura está abierto a cada miembro activo; la acción destructiva de falso positivo está restringida más arriba:| Acción | Ruta | Rol |
|---|---|---|
| Listar / agrupar / estadísticas / exportar coincidencias | GET /api/guardrail/match* | Member |
| Detalle de una sola coincidencia | GET /api/guardrail/match/:id | Member |
| Marcar / des-marcar falso positivo | POST / DELETE /api/guardrail/match/:id/mark-fp | Admin |
| Editar un guardrail (incl. Log raw content) | PUT /api/guardrail/ | Developer+ |
8. Un valor por defecto de privacidad práctico
Para la mayoría de los espacios de trabajo la forma correcta es: deja Log raw content apagado, ejecuta tus guardrails sobre metadatos, y activa el toggle temporalmente para una sola política cuando estés depurando activamente por qué una regla se dispara como lo hace. Luego apágalo de nuevo — las nuevas coincidencias dejan de llevar subcadenas inmediatamente.9. Dónde ir a continuación
Feed de coincidencias
Navega, agrupa, filtra y exporta cada coincidencia registrada.
Afinar falsos positivos
Marca y refina coincidencias para silenciar una regla ruidosa.
Versionado
Cada cambio de toggle es un cambio versionado y revertible.
Compliance
Retención, borrado de datos del titular e informes firmados.
