La línea base de Agentes Seguros es el control de autonomía — no hay un
objeto “baseline” separado. Aplicar un nivel de autonomía atómicamente escribe
una política de firewall y un guardrail (nombrado por el nivel) y los convierte
en la postura en vivo de tu espacio de trabajo, en una transacción. Puedes
abrirlos y editarlos después. Deshacer de un clic restaura el estado previo
desde un snapshot de auditoría.
1. Qué hace el control de autonomía
Tres niveles, cada uno cubriendo las mismas dos capas:| Nivel | Postura del Firewall | Guardrails | Observe mode |
|---|---|---|---|
tight | Defecto-deny; shell destructivo y egress SSRF denegados | PII Shield + Secrets Blocker aplicados | Desactivado |
balanced | Auditoría por defecto; shell destructivo denegado | PII Shield en modo solo-auditoría (marca PII) | Desactivado |
permissive | Sin política de aplicación | Sin guardrails | Activado — cada llamada a herramienta se registra como brecha de cobertura |
balanced es la postura de inicio recomendada. Audita todo lo que hacen
tus agentes y marca PII, mientras aún deniega las acciones más destructivas
(shell destructivo) — así ves el comportamiento real de tus agentes antes de
decidir qué más restringir. Para una pasada que no bloquee nada, empieza
en permissive.
tight es el objetivo correcto una vez que entiendes el comportamiento
normal de tu agente. Aplica una postura defecto-deny de fábrica: shell
destructivo denegado, egress SSRF denegado y ambos guardrails PII Shield y
Secrets Blocker activos (examinando tus solicitudes en busca de PII y
secretos).
permissive desactiva toda aplicación pero deja el observe mode
activado, así cada llamada a herramienta sigue registrándose. Úsalo para
auditar un agente completamente nuevo sin riesgo de bloqueos accidentales
— luego muévete a balanced o tight una vez que sepas lo que hace.
2. Cómo aplicar un nivel
Previsualizar el cambio (opcional pero recomendado)
Simula el nivel antes de aplicarlo. La vista de consola Simulate
(bajo Firewall → Posture) o la API muestra exactamente qué reglas y
guardrails estarían activos — nada cambia.Rol: Member (solo lectura, sin cambio).
Elige un nivel en la consola
Ve a Firewall → Posture en la consola. Selecciona
balanced,
tight o permissive del control de nivel de autonomía y confirma.
El cambio surte efecto en la siguiente llamada a herramienta — sin
redespliegue.Rol: Developer+ requerido para aplicar.O aplica vía la API
audit_id — guárdalo. Lo necesitas para
deshacer.Rol: Developer+.Observa eventos y coincidencias
Después de aplicar, ve a Firewall → Events / Runs para ver los
veredictos de llamadas a herramienta y Guardrails → Matches para ver
los hits de política de contenido. Ambos feeds se actualizan en tiempo
real. Si algo se dispara que no esperabas, revísalo antes de endurecer
más.
Deshacer si es necesario
Cualquier cambio de autonomía puede deshacerse con una sola llamada. El
deshacer restaura el estado previo exacto — políticas, reglas,
guardrails, configuraciones — desde el snapshot de auditoría, no un
restablecimiento genérico.Rol: Developer+.El
audit_id se devuelve cuando aplicas el nivel (Paso 3) y también
es visible en Firewall → Audit.3. El camino recomendado
Empieza enbalanced → simula tight → observa → endurece.
- Aplica
balanced— obtienes un rastro de auditoría completo; solo el shell destructivo se deniega, todo lo demás se audita. Ejecuta tus agentes normalmente durante un día o dos. - Simula
tight— ejecutaGET /api/workspace/firewall/simulate?level=tighty compara lo que se denegaría contra lo que viste en el feed de Events. Si las llamadas de shell destructivo o las solicitudes salientes al estilo SSRF son parte de tu tráfico normal, corrígelas en el agente primero. - Observa Events y Matches — Firewall → Events muestra cada veredicto de llamada a herramienta; Guardrails → Matches muestra los hits de política de contenido. Ambos son filtrables por veredicto, herramienta, ejecución y sesión.
- Aplica
tight— una vez que la salida de simulate no contiene sorpresas, aplicatight. Deshacer está a una llamada de distancia si algo se rompe en producción. - Ajusta con reglas — usa las Reglas del firewall para crear excepciones o añadir controles que los niveles preestablecidos no cubren. El nivel de autonomía es tu piso; las reglas personalizadas añaden precisión.
4. Requisitos de rol
| Acción | Rol mínimo |
|---|---|
Simular un nivel (GET .../simulate) | Member |
| Leer el rastro de auditoría | Member |
| Ver coincidencias de guardrail | Member |
| Ver Events & Runs del firewall | Developer+ |
| Aplicar un nivel de autonomía | Developer+ |
| Deshacer un cambio de autonomía | Developer+ |
5. Lo que esto no es
- No es una caja negra. Aplicar un nivel de autonomía escribe una política de firewall y un guardrail reales (nombrados por el nivel) y los convierte en la postura en vivo de tu espacio de trabajo. Puedes abrirlos, inspeccionarlos y editarlos después — es un punto de partida rápido, no un preset bloqueado.
- Reversible, con límites. Deshacer de un clic restaura el estado previo de Firewall y Guardrails desde un snapshot de auditoría. Para un espacio de trabajo muy grande cuyo snapshot supere el límite de tamaño del log de auditoría, la aplicación sigue teniendo éxito pero deshacer no está disponible para ese cambio — simplemente vuelves a aplicar el nivel que quieres. Raro, pero vale la pena saberlo.
- No es un sustituto de las claves con alcance. El control de autonomía establece la postura por defecto del espacio de trabajo. Las claves API individuales todavía pueden adjuntarse a políticas específicas para un control más fino. Ver Guardrails vs. Firewall para cómo se componen las capas.
El control de autonomía está diseñado para los primeros 30 minutos — obtén protección rápido, entiende el comportamiento real de tus agentes, luego endurece desde una posición de visibilidad en vez de conjeturas.
Inicio rápido
Configuración completa de zero-trust en 5 minutos, incluyendo claves con
alcance y guardrails.
Firewall
Detalle a nivel de regla — veredictos, superficies, predicados de
argumentos y aprobación HITL.
