db.query às 3h de domingo,
um agente martelando uma ferramenta que falha em um loop apertado, um salto
ferramenta-a-ferramenta que este workspace nunca fez antes. Cada chamada passa
por cada regra; o padrão é o problema.
A detecção de anomalias do firewall é a camada comportamental. O gateway
aprende a forma normal de uso de ferramentas do seu workspace e pontua a
atividade ao vivo contra ela, trazendo à tona os desvios em um feed que qualquer
Member pode ler. É como você percebe um agente comprometido ou um loop
descontrolado sem ter pré-escrito uma regra para uma forma que você nunca viu.
Esta página é o landing focado para esse feed de detecção de anomalias do firewall; a
Visão geral do Firewall é a
referência profunda.
O feed de anomalias é detecção, não enforcement. Ele lhe diz o que parece
fora — ele não bloqueia. Quando um padrão é real, você o transforma em uma
regra ou um
veredito com rate-limit para que a próxima
ocorrência seja parada inline. Ler o feed é aberto a cada Member; transformar um
achado em política é Developer+.
1. O que a detecção de anomalias do firewall sinaliza
Quatro tipos de sinal, cada um ligado a um modo de falha diferente:rate_spike — chamadas demais para esta hora
rate_spike — chamadas demais para esta hora
Volume de chamada por ferramenta pontuado contra um baseline aprendido de
hora-da-semana. Uma ferramenta dispara
rate_spike quando sua contagem
cruza um piso absoluto e roda alta relativa ao baseline para aquela
hora, ou quando seu z-score cruza o threshold. Chavear em hora-da-semana
(não hora-do-dia) significa que terça-14:00 é comparada com terças-14:00
passadas, de modo que o tráfego de pico de dia útil legítimo não se lê como
um pico enquanto o mesmo volume às 3h de domingo sim.burn_spike — custo roda quente vs baseline
burn_spike — custo roda quente vs baseline
A mesma comparação de hora-da-semana, aplicada ao custo acumulado em vez
da contagem de chamadas. Uma ferramenta cujo gasto roda bem acima de sua
norma de custo aprendida aparece como um
burn_spike — o sinal de
alerta-precoce para um agente que é caro antes de ser destrutivo.retry_loop — a mesma chamada, vez após vez
retry_loop — a mesma chamada, vez após vez
Um grupo
(conversation, tool, arguments) que se repete muitas vezes dentro
de uma janela curta — um agente preso reemitindo a mesma chamada de
ferramenta que falha em vez de se recuperar. Polling legítimo e lento não o
dispara; o sinal é um loop apertado.novel_path — uma transição nunca vista antes
novel_path — uma transição nunca vista antes
Uma transição consecutiva
tool_a → tool_b para a qual este workspace não
tem baseline aprendido. A primeira vez que um agente vai, digamos, de
crm.read → http.fetch, essa aresta é nova — exatamente o tipo de passo que
uma cadeia de
exfiltração de dados dá.2. O baseline de 14 dias
O detector não é um threshold fixo — é uma norma aprendida. Para cada bucket(tool, hour-of-week) o gateway mantém uma contagem-de-chamada e custo
esperados móveis, preenchidos a partir de um lookback de 14 dias (cerca de
duas ocorrências de cada bucket de hora-da-semana — o suficiente para suavizar
um único dia estranho sem perder a forma semanal). novel_path usa o baseline
de transição paralelo: a contagem de ocorrência aprendida para cada aresta
tool_a → tool_b naquela hora-da-semana.
Um workspace novinho ainda não tem baseline. Tudo bem: sem norma aprendida, os
detectores de volume caem para um piso absoluto, de modo que uma enchente óbvia
ainda é pega no dia um enquanto as normas por hora se preenchem.
| Sinal | De que ele aprende |
|---|---|
rate_spike / burn_spike | Contagem e custo por (tool, hour-of-week), móvel de 14 dias. |
novel_path | Contagem de transição por (tool_a → tool_b, hour-of-week). |
retry_loop | Sem baseline — um threshold de repetição em janela em (conversation, tool, args). |
O feed reporta nomes de ferramenta, ids de token redigidos e contagens
apenas. Um id de chave de API bruto nunca aparece — cada item carrega um
digest unidirecional do token chamador, de modo que você pode distinguir duas
anomalias sem o feed jamais vazar a chave por trás delas.
3. Uma leitura concreta
Digamos que uma chave de agente comece a entrar em loop. Puxe o feed no console em Security → Firewall → Anomalies, ou leia-o diretamente — qualquer Member pode:retry_loop não carrega baseline nem z_score (esses campos
permanecem 0 — pertencem aos detectores de volume/custo), e carrega um id
opaco estável de modo que dois loops distintos na mesma ferramenta não colidem
em uma linha. Um rate_spike é o inverso: ele reporta um baseline aprendido e
um z_score, e deixa id vazio.
Cada item nomeia a ferramenta, o token redigido, quantas chamadas dispararam, o
z-score (apenas sinais de volume/custo), e uma suggested_action (rate_limit,
block_tool, ou review). A partir daqui você age: solte uma
regra deny na ferramenta,
valide seus argumentos, ou abra o
log de eventos para ver exatamente o que o
agente fez.
4. Dando snooze no feed
Um teste de carga conhecido ou um backfill planejado vai acender o feed. Em vez de perseguir ruído, dê snooze nele — por até 7 dias:snoozed_until; ele se limpa no momento em que o prazo passa. O cap é um teto
rígido — um until digitado errado ou hostil mais adiante é clampeado para que
a detecção de anomalias não possa ser silenciada indefinidamente. Postar um
until passado ou agora limpa um snooze existente.
Ler o feed é uma ação Member; dar snooze nele é Developer+ — mutar
um sinal de segurança de todo o workspace é uma escrita, não uma leitura.
5. RBAC num relance
A superfície de analytics se divide ao longo da linha usual de leitura/ação:| Ação | Papel |
|---|---|
| Ler o feed de anomalias | Member |
| Ler configurações, políticas, ferramentas descobertas | Member |
| Dar snooze no feed | Developer+ |
| Events, runs, aggregate, trace | Developer+ |
| Criar uma regra a partir de um achado | Developer+ |
6. Do sinal à política
O feed é o começo de um loop, não o fim:Detecte o padrão
Um
novel_path ou rate_spike mostra uma forma que você não esperava.
Leia-a contra o log de eventos para
confirmar que é real, não um caso isolado.Escreva a regra
Transforme o achado em enforcement — um
block, uma
cláusula de argumento, uma
regra de sequência para a cadeia, ou
um cap de custo para o burn.
Faça o rollout com segurança
Lance a regra sob shadow mode primeiro
para medir seu raio de explosão antes que ela bloqueie uma única chamada,
depois aplique o enforcement.
Para onde ir a seguir
Visão geral do Firewall
A referência completa de detecção de anomalias e o resto do plano de
política.
Log de eventos
Aprofunde de uma anomalia até as chamadas exatas por trás dela.
Bloquear uma ferramenta
Transforme um achado em uma regra de enforcement.
Modos de enforcement
Como detecção, audit, shadow e enforce se encaixam.
