api.orcarouter.ai: un veredicto por defecto deny más una o
más reglas allow con clave en un
tool_name_glob. Para el lenguaje de
coincidencia completo detrás de esas reglas, ver
Reglas del Firewall.
Las listas de permitidos se autoran en la consola bajo
Security → Firewall, o vía las rutas de gestión
/api/workspace/firewall/* (tu sesión / token de acceso — no una clave
de relay sk-orca-…). Solo las llamadas /v1/* de tu agente usan la clave
de relay. Crear o editar una política es una acción Developer+.1. Por qué defecto-deny para agentes
Una lista de bloqueados (“denegarshell.exec, denegar db.delete, …”)
nunca es más completa que la última amenaza en la que pensaste. Una lista de
permitidos invierte la carga de la prueba: el gateway deniega todo lo que la
política no permite explícitamente, así que una herramienta desconocida
queda cerrada por construcción.
Veredicto por defecto = deny
El piso de la política. Sin ninguna regla coincidente, cada llamada a
herramienta se bloquea.
Las reglas allow optan por las herramientas de vuelta
Cada regla
allow nombra las herramientas que realmente usas — por
nombre exacto o por glob.default_verdict de la
política. Así que una lista de permitidos es simplemente: reglas allow de
alta prioridad para tus herramientas reales, con un piso deny que captura
todo lo demás.
2. Un ejemplo: lista de permitidos de las herramientas de un agente de investigación
Supón que tu agente solo necesita buscar en la web y leer de una base de conocimiento — herramientas llamadasweb.search y kb.read. Todo lo demás
(shell, escrituras de archivos, mutaciones de base de datos, cualquier
herramienta que una inyección de prompts pudiera conjurar) debe ser
denegado.
Construye la política como deny por defecto + dos reglas allow:
Crea la política con un default deny
Security → Firewall → Policies → New policy. Nómbrala, deja
Enabled activado, y establece el veredicto por defecto a
deny.
Este es el piso cerrado — ver
Crear una política.Añade una regla allow por familia de herramientas
En el editor de reglas añade dos reglas, ambas
verdict = allow:priority | tool_name_glob | verdict |
|---|---|---|
10 | web.search | allow |
20 | kb.* | allow |
web.search es una coincidencia exacta; kb.* es un glob de prefijo
que permite kb.read, kb.search y cualquier herramienta kb.* futura
sin reeditar la política.web.search y kb.read pasan; una llamada a shell.exec no coincide
con ninguna regla allow, golpea el piso deny, y vuelve como HTTP 400
con el código firewall_blocked en la superficie inbound — ver
cómo se ve un bloqueo.
3. El glob en una pantalla
tool_name_glob es una gramática pequeña y sensible a mayúsculas — sin
regex, tiempo lineal. Las formas que importan para una lista de permitidos:
| Patrón | Permite |
|---|---|
web.search | Exactamente esa herramienta. |
kb.* | Prefijo — kb.read, kb.search (no kb pelado). |
*.search | Sufijo — web.search, kb.search, y search pelado. |
*.tools.* | Infijo — byo.tools.fetch y similares. |
4. Lánzalo sin romper tu agente
Defecto-deny es la postura con más probabilidad de bloquear una herramienta que olvidaste que necesitabas. Escalónalo:Ponlo en shadow primero
Ponlo en shadow primero
Activa el modo shadow. La política
evalúa y registra exactamente como lo haría en vivo, pero degrada cada
deny a
audit con la razón prefijada con [shadow] would …. Ejecuta
tráfico real, luego lee el feed de eventos.Encuentra las herramientas que realmente llamas
Encuentra las herramientas que realmente llamas
Herramientas descubiertas lista cada
herramienta que el espacio de trabajo ha visto, marcada covered o
gap. Los eventos “would-deny” del modo shadow más los gaps te dicen
exactamente qué reglas allow aún necesitas.
Prueba antes de aplicar
Prueba antes de aplicar
El sandbox de Test ejecuta en seco la
política contra una llamada a herramienta de muestra y devuelve el
veredicto, la regla coincidente y la razón — nada despachado, nada
persistido. Confirma que
web.search permite y shell.exec deniega,
luego apaga shadow.Una llamada inbound denegada cuesta cero tokens de modelo — se bloquea
antes de que el modelo upstream se ejecute — y se marca como skip-retry,
así que una herramienta bloqueada no quemará un presupuesto de reintentos
volviendo a bloquearse. Ver
Veredictos.
5. Dónde ir a continuación
Bloquear herramientas específicas
Lo inverso — mantén un piso defecto-allow y deniega herramientas
nombradas.
Validar argumentos
Permite una herramienta, pero solo con argumentos seguros (
db.query
pero no DROP TABLE).Prioridad de reglas
Cómo gana-la-primera-coincidencia ordena tus reglas allow por encima del
piso deny.
Veredictos
allow, audit, deny, sanitize, pending_approval, cap_cost.
