Saltar al contenido principal
El gateway se sitúa entre tu agente y cada modelo que llama. Eso lo convierte en el único punto que ve cada llamada independientemente del proveedor — cada prompt, cada respuesta, cada llamada a herramienta y cada solicitud saliente que tu agente enruta a través de él — sin importar qué SDK emitió la llamada. Ese punto de estrangulamiento es donde pertenecen la inspección y la aplicación. (Lo que no puede ver — una herramienta que se ejecuta completamente dentro de tu proceso y nunca cruza el gateway — está cubierto en §4.) Esta página explica exactamente qué puede y no puede ver el gateway, cómo funciona la detección y cómo cerrar las brechas.

1. Por qué el gateway es el punto de inspección correcto

La mayoría de los controles de seguridad viven en la aplicación: envoltorios de biblioteca, hooks de framework de agentes, SDKs por proveedor. Esos controles tienen un fallo estructural fatal — se rompen tan pronto como añades un segundo proveedor, cambias de framework o dejas que un agente auto-instale una nueva skill. El gateway no tiene ninguna de esas costuras. Cada llamada que emite tu agente, independientemente del modelo, proveedor o cómo llegó la capacidad de la herramienta, pasa por un único punto antes de que nada llegue al upstream. Esa es la única capa donde puedes hacer una garantía: si ocurrió, el gateway lo vio. OrcaRouter usa esa posición para dos pasadas de aplicación distintas:
  • Los guardrails examinan texto — el prompt que envía tu agente y la respuesta que devuelve el modelo. Un bloqueo de guardrail devuelve HTTP 400 guardrail_blocked y no cuesta cuota.
  • El Firewall juzga acciones — las herramientas que llama un agente, los servidores MCP que alcanza y los destinos de red que reporta. Un deny del firewall devuelve HTTP 400 firewall_blocked en la superficie inbound, o un error de herramienta en la superficie MCP, para que el modelo vea el rechazo y pueda razonar sobre él.
Ambas capas se configuran una vez en tu espacio de trabajo y se adjuntan a una clave API. Sin redespliegue. Sin cambio de SDK. Tu agente sigue llamando a https://api.orcarouter.ai/v1 exactamente como antes.

2. Las cuatro superficies de aplicación

El Firewall evalúa cada llamada a herramienta contra exactamente una superficie — el punto en el ciclo de vida de la llamada donde el gateway la ve.
SuperficieLo que ve el gateway
inboundLas herramientas que tu agente anuncia al modelo en la solicitud — las definiciones de herramienta. Bloquear aquí evita que el modelo elija alguna vez una herramienta peligrosa.
responseLos tool_calls que el modelo emite en su respuesta — las acciones elegidas por el modelo antes de que se despachen.
mcpUn tools/call despachado a través del gateway MCP del Firewall o evaluado vía el hook del SDK — la llamada en el momento del despacho.
egressUn destino de red saliente (host / IP / CIDR) que reporta una herramienta — la superficie de SSRF y exfiltración de datos.
Los guardrails añaden dos etapas de texto más que se superponen sobre las superficies anteriores: input (el prompt y los mensajes de la solicitud) y output (el texto de respuesta del modelo). Una sola solicitud puede pasar por todas ellas.

3. Detección en el primer uso

La detección ocurre en el gateway, en el primer uso — no en el momento de instalación. Una herramienta, servidor MCP o skill que un agente auto-instala se captura la primera vez que su llamada cruza el gateway. Esto es deliberado: el gateway es el único punto de estrangulamiento que ve cada proveedor, cada agente y cada llamada independientemente de cómo llegó la capacidad. Esperar la detección en tiempo de instalación perdería las capacidades cargadas en tiempo de ejecución.
Esto significa que una herramienta novedosa aterriza en la vista de Discovered tools en el momento en que aparece en una solicitud, aunque ninguna regla la nombre. Activa el observe mode para registrar cada llamada a herramienta que no tiene una regla coincidente como brecha de cobertura — esa vista impulsa la creación de políticas desde el tráfico real.

4. Lo que el gateway no puede ver

La garantía de inspección cubre las llamadas que cruzan el gateway. No se extiende a una herramienta que tu agente ejecuta completamente dentro de su propio proceso — una que lee un archivo local, llama a una función de biblioteca o ejecuta un subproceso sin enviar nunca un mensaje al gateway. Este es un límite honesto, no un fallo de diseño. El objetivo de diseño es hacer del gateway el camino auditado para las llamadas que importan — las que tienen consecuencias en el mundo real:
Dónde se ejecuta¿Lo ve el gateway?Cómo cerrar la brecha
Llamada a herramienta mediada por modelo (el modelo emite tool_calls)Sí — superficie responseNo se necesita acción; ya está gobernado.
Despacho MCP a través del gateway MCP del FirewallSí — superficie mcpNo se necesita acción; ya está gobernado.
Tu agente llama a POST /api/v1/firewall/evaluate antes del despachoSí — evaluado en líneaYa está gobernado vía el hook de evaluación.
La herramienta se ejecuta en proceso, sin contacto con el gatewayNoEnruta el despacho MCP y las herramientas que llaman a la red a través del gateway en vez de llamarlas directamente desde el proceso del agente.
Si tienes herramientas que se ejecutan en proceso hoy y tienen consecuencias en el mundo real, el camino hacia la cobertura es registrarlas como servidores MCP detrás del gateway MCP del Firewall o llamar al hook de evaluación desde tu bucle de agente antes del despacho.

5. Control de acceso por rol en los datos de inspección

El acceso a las superficies de inspección está restringido por rol dentro de tu espacio de trabajo:
CapacidadRol mínimo
Leer coincidencias de guardrail, políticas del firewall y herramientas descubiertasMember
Leer los feeds de Events & Runs del firewallDeveloper
Crear o cambiar guardrails, políticas del firewall, reglasDeveloper
Exportaciones de cumplimiento, texto plano de clave con alcance de gateway de firewall, flag is_firewall_gatewayAdmin
Un token con alcance de gateway de firewall (la clave usada para llamar a /api/v1/firewall/evaluate y el gateway MCP) requiere el rol Admin para crear. Una clave API regular devuelve 403 en esas rutas.

6. Dónde ir a continuación

La pila de controles

El camino completo de la solicitud — clave, guardrails, modelo, firewall, auditoría — en un diagrama.

Responsabilidad compartida

Qué asegura el gateway y qué permanece en tu aplicación.

Agent Firewall

Crea políticas, configura superficies y gobierna llamadas a herramienta en profundidad.
El gateway es el único punto de inspección para cada llamada que lo cruza — configura tus políticas una vez y cada proveedor, cada agente y cada llamada a herramienta está cubierta.