1. Por que o gateway é o ponto de inspeção correto
A maioria dos controles de segurança vive na aplicação: wrappers de biblioteca, hooks de framework de agente, SDKs por provedor. Esses controles têm uma falha estrutural fatal — eles quebram assim que você adiciona um segundo provedor, troca de framework ou deixa um agente auto-instalar uma nova skill. O gateway não tem nenhuma dessas juntas. Cada chamada que seu agente emite, independentemente do modelo, provedor ou como a capacidade da ferramenta chegou, transita por um único ponto antes que qualquer coisa alcance o upstream. Essa é a única camada onde você pode fazer uma garantia: se aconteceu, o gateway viu. O OrcaRouter usa essa posição para dois passes distintos de enforcement:- Os Guardrails inspecionam texto — o prompt que seu agente envia e a
resposta que o modelo retorna. Um bloqueio de guardrail retorna HTTP 400
guardrail_blockede não custa cota. - O Firewall julga ações — as ferramentas que um agente chama, os
servidores MCP que ele alcança e os destinos de rede que ele reporta. Um
deny do firewall retorna HTTP 400
firewall_blockedna superfície inbound, ou um erro de ferramenta na superfície MCP, para que o modelo veja a rejeição e possa raciocinar sobre ela.
https://api.orcarouter.ai/v1 exatamente como antes.
2. As quatro superfícies de enforcement
O Firewall avalia cada chamada de ferramenta contra exatamente uma superfície — o ponto no ciclo de vida da chamada onde o gateway a vê.| Superfície | O que o gateway vê |
|---|---|
inbound | As ferramentas que seu agente anuncia ao modelo na requisição — as definições de ferramenta. Bloquear aqui impede o modelo de escolher uma ferramenta perigosa. |
response | Os tool_calls que o modelo emite em sua resposta — as ações escolhidas pelo modelo antes de serem despachadas. |
mcp | Um tools/call despachado através do gateway MCP do Firewall ou avaliado via o hook do SDK — a chamada no momento do dispatch. |
egress | Um destino de rede outbound (host / IP / CIDR) que uma ferramenta reporta — a superfície de SSRF e exfiltração de dados. |
input (o prompt e as mensagens da requisição) e output
(o texto da resposta do modelo). Uma única requisição pode passar por todos
eles.
3. Detecção no primeiro uso
A detecção acontece no gateway, no primeiro uso — não no momento da
instalação. Uma ferramenta, servidor MCP ou skill que um agente auto-instala
é capturada na primeira vez que sua chamada cruza o gateway. Isso é deliberado:
o gateway é o único ponto de estrangulamento que vê cada provedor, cada agente
e cada chamada independentemente de como a capacidade chegou. Aguardar a
detecção no momento da instalação perderia capacidades carregadas em tempo de
execução.
4. O que o gateway não pode ver
A garantia de inspeção cobre chamadas que cruzam o gateway. Ela não se estende a uma ferramenta que seu agente roda inteiramente dentro de seu próprio processo — uma que lê um arquivo local, chama uma função de biblioteca ou executa um subprocesso sem nunca enviar uma mensagem ao gateway. Esse é um limite honesto, não uma falha de design. O objetivo de design é tornar o gateway o caminho auditado para as chamadas que importam — as que têm consequências no mundo real:| Onde roda | Gateway vê? | Como fechar a lacuna |
|---|---|---|
Chamada de ferramenta mediada pelo modelo (o modelo emite tool_calls) | Sim — superfície response | Nenhuma ação necessária; já governada. |
| Dispatch MCP através do gateway MCP do Firewall | Sim — superfície mcp | Nenhuma ação necessária; já governada. |
Seu agente chama POST /api/v1/firewall/evaluate antes de despachar | Sim — avaliada inline | Já governada via o hook de avaliação. |
| Ferramenta roda em processo, sem contato com o gateway | Não | Roteie o dispatch MCP e ferramentas que fazem chamadas de rede pelo gateway em vez de chamá-las diretamente do processo do agente. |
5. Controle de acesso por papel nos dados de inspeção
O acesso às superfícies de inspeção tem escopo por papel dentro do seu workspace:| Capacidade | Papel mínimo |
|---|---|
| Ler correspondências de guardrail, políticas de firewall e ferramentas descobertas | Member |
| Ler os feeds de Eventos e Runs do firewall | Developer |
| Criar ou alterar guardrails, políticas de firewall, regras | Developer |
Exportações de compliance, texto simples de chave com escopo de firewall-gateway, flag de chave is_firewall_gateway | Admin |
Um token com escopo de firewall-gateway (a chave usada para chamar
/api/v1/firewall/evaluate e o gateway MCP) exige o papel de Admin para
criar. Uma chave de API regular retorna 403 nessas rotas.6. Para onde ir a seguir
A pilha de controle
O caminho completo da requisição — chave, guardrails, modelo, firewall,
auditoria — em um diagrama.
Responsabilidade compartilhada
O que o gateway protege e o que fica na sua aplicação.
Agent Firewall
Crie políticas, configure superfícies e governe chamadas de ferramenta
em profundidade.
