Saltar al contenido principal
Las reglas de firewall estáticas capturan las llamadas que supiste nombrar. No pueden capturar la llamada que está individualmente permitida pero mal en agregado — 200 llamadas db.query a las 3am del domingo, un agente martillando una herramienta que falla en un bucle ajustado, un salto de herramienta a herramienta que este espacio de trabajo nunca ha hecho antes. Cada llamada pasa cada regla; el patrón es el problema. La detección de anomalías del firewall es la capa de comportamiento. El gateway aprende la forma normal de uso de herramientas de tu espacio de trabajo y puntúa la actividad en vivo contra ella, sacando a la luz las desviaciones en un feed que cualquier Member puede leer. Es cómo notas un agente comprometido o un bucle descontrolado sin haber pre-escrito una regla para una forma que nunca habías visto. Esta página es el aterrizaje enfocado para ese feed de detección de anomalías del firewall; la Visión general del Firewall es la referencia profunda.
El feed de anomalías es detección, no aplicación. Te dice qué se ve raro — no bloquea. Cuando un patrón es real, lo conviertes en una regla o un veredicto con límite de tasa para que la siguiente ocurrencia se detenga en línea. Leer el feed está abierto a cada Member; convertir un hallazgo en política es Developer+.

1. Qué marca la detección de anomalías del firewall

Cuatro tipos de señal, cada uno ligado a un modo de fallo diferente:
El volumen de llamadas por herramienta puntuado contra una línea base de hora-de-la-semana aprendida. Una herramienta dispara rate_spike cuando su conteo supera un piso absoluto y corre alto en relación con la línea base para esa hora, o cuando su z-score cruza el umbral. Tener clave en hora-de-la-semana (no hora-del-día) significa que martes-14:00 se compara con martes-14:00 pasados, así que el tráfico legítimo de pico de día laboral no se lee como un pico mientras que el mismo volumen a las 3am del domingo sí.
La misma comparación de hora-de-la-semana, aplicada al coste acumulado en vez del conteo de llamadas. Una herramienta cuyo gasto corre muy por encima de su norma de coste aprendida sale a la luz como un burn_spike — la señal de advertencia temprana para un agente que es costoso antes de ser destructivo.
Un grupo (conversation, tool, arguments) que se repite muchas veces dentro de una ventana corta — un agente atascado reemitiendo la misma llamada a herramienta que falla en vez de recuperarse. El polling legítimo lento no lo dispara; la señal es un bucle ajustado.
Una transición consecutiva tool_a → tool_b para la que este espacio de trabajo no tiene línea base aprendida. La primera vez que un agente va, digamos, crm.read → http.fetch, ese borde es nuevo — exactamente el tipo de paso que toma una cadena de exfiltración de datos.
La detección de anomalías complementa las reglas de secuencia. Una regla de secuencia coincide con una cadena que definiste de antemano; novel_path marca una transición que no definiste — es cómo descubres las cadenas que vale la pena escribir una regla de secuencia.

2. La línea base de 14 días

El detector no es un umbral fijo — es una norma aprendida. Para cada bucket (tool, hour-of-week) el gateway mantiene un conteo de llamadas y coste esperado móvil, rellenado desde una mirada hacia atrás de 14 días (unas dos ocurrencias de cada bucket de hora-de-la-semana — suficiente para suavizar un solo día extraño sin perder la forma semanal). novel_path usa la línea base de transición paralela: el conteo de ocurrencia aprendido para cada borde tool_a → tool_b en esa hora-de-la-semana. Un espacio de trabajo completamente nuevo no tiene línea base todavía. Eso está bien: sin una norma aprendida, los detectores de volumen caen a un piso absoluto, así que una inundación obvia aún se captura en el día uno mientras las normas por hora se rellenan.
SeñalDe qué aprende
rate_spike / burn_spikeConteo y coste por (tool, hour-of-week), móvil de 14 días.
novel_pathConteo de transiciones por (tool_a → tool_b, hour-of-week).
retry_loopSin línea base — un umbral de repetición por ventana sobre (conversation, tool, args).
El feed reporta solo nombres de herramienta, ids de token redactados y conteos. Un id de clave API en bruto nunca aparece — cada ítem lleva un digest de una sola vía del token que llama, así que puedes distinguir dos anomalías sin que el feed filtre jamás la clave detrás de ellas.

3. Una lectura concreta

Supón que una clave de agente empieza a entrar en bucle. Saca el feed en la consola bajo Security → Firewall → Anomalies, o léelo directamente — cualquier Member puede:
curl https://api.orcarouter.ai/api/workspace/firewall/anomalies \
  -H "Authorization: Bearer $ORCA_SESSION_TOKEN"
{
  "data": {
    "items": [
      {
        "id": "3f1c9a7b0e2d4a86",
        "kind": "retry_loop",
        "tool_name": "db.query",
        "token_id_redacted": "sk-***-9f2a",
        "count": 412,
        "baseline": 0,
        "z_score": 0,
        "suggested_action": "rate_limit",
        "first_seen": 1749470400,
        "last_seen": 1749470520
      }
    ],
    "snoozed_until": 0
  }
}
Un ítem retry_loop no lleva baseline ni z_score (esos campos quedan en 0 — pertenecen a los detectores de volumen/coste), y lleva un id opaco estable para que dos bucles distintos en la misma herramienta no colisionen en una fila. Un rate_spike es lo inverso: reporta un baseline aprendido y un z_score, y deja id vacío.
$ORCA_SESSION_TOKEN es tu sesión de consola / token de acceso — la misma auth que cada ruta de gestión /api/workspace/firewall/*. No es una clave de relay sk-orca-… (esas son solo para llamadas a modelo /v1/*) ni una clave de gateway de firewall. Una clave de relay en esta ruta se rechaza.
Cada ítem nombra la herramienta, el token redactado, cuántas llamadas se dispararon, el z-score (solo señales de volumen/coste), y un suggested_action (rate_limit, block_tool o review). De aquí actúas: suelta una regla deny sobre la herramienta, valida sus argumentos, o abre el registro de eventos para ver exactamente qué hizo el agente.

4. Posponer el feed

Una prueba de carga conocida o un backfill planeado iluminará el feed. En vez de perseguir ruido, pospónlo (snooze) — por hasta 7 días:
curl -X POST https://api.orcarouter.ai/api/workspace/firewall/anomalies/snooze \
  -H "Authorization: Bearer $ORCA_SESSION_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"until": 1749643200}'
Mientras un snooze está activo el feed no devuelve ítems y reporta snoozed_until; se limpia solo en el momento en que pasa la fecha límite. El tope es un techo duro — un until mal tecleado u hostil más allá se acota para que la detección de anomalías no pueda silenciarse indefinidamente. Hacer POST de un until pasado o actual limpia un snooze existente.
Leer el feed es una acción Member; posponerlo es Developer+ — silenciar una señal de seguridad a nivel de espacio de trabajo es una escritura, no una lectura.

5. RBAC de un vistazo

La superficie de analítica se divide a lo largo de la línea habitual de leer/actuar:
AcciónRol
Leer el feed de anomalíasMember
Leer configuración, políticas, herramientas descubiertasMember
Posponer el feedDeveloper+
Events, runs, aggregate, traceDeveloper+
Autorar una regla desde un hallazgoDeveloper+
Las vistas agregadas más ligeras — configuración, políticas y el mapa de cobertura de herramientas descubiertas — son lecturas Member también; el detalle a nivel de fila de eventos y ejecuciones es Developer+, porque lleva datos de argumentos por llamada.

6. De la señal a la política

El feed es el inicio de un bucle, no el final:
1

Detecta el patrón

Un novel_path o rate_spike muestra una forma que no esperabas. Léelo contra el registro de eventos para confirmar que es real, no un caso aislado.
2

Escribe la regla

Convierte el hallazgo en aplicación — un bloqueo, una cláusula de argumentos, una regla de secuencia para la cadena, o un tope de coste para el gasto.
3

Lánzalo de forma segura

Aterriza la regla bajo modo shadow primero para medir su radio de explosión antes de que bloquee una sola llamada, luego aplica.

Dónde ir a continuación

Visión general del Firewall

La referencia completa de detección de anomalías y el resto del plano de política.

Registro de eventos

Profundiza desde una anomalía hacia las llamadas exactas detrás de ella.

Bloquear una herramienta

Convierte un hallazgo en una regla de aplicación.

Modos de aplicación

Cómo encajan detección, audit, shadow y aplicar.
Para las amenazas que estas señales exponen, ver exfiltración de datos y agencia excesiva.