Guardrails vs. Agent Firewall — quando usare quale
guardrails vs firewall: distinzione in una riga, confronto affiancato e mapping minaccia-layer per aiutarti a decidere quale piano di sicurezza di OrcaRouter intercetta ogni rischio.
La risposta breve: i Guardrails governano il testo; il Firewall governa le
azioni. Sono complementari — una singola richiesta scorre attraverso entrambi
— e il modo più rapido per configurarli insieme è un
livello di autonomia.Il resto di questa pagina è per i casi in cui hai bisogno di sapere quale layer
possiede una minaccia specifica.
Ruolo richiesto. Qualsiasi membro del workspace può leggere policy e il
feed Matches del guardrail; il feed Events del firewall richiede il ruolo
Developer. Creare o modificare guardrail o policy del firewall richiede
anche Developer o superiore.
Chiamate a tool, dispatch MCP, destinazioni di rete in uscita
I Guardrails scattano prima della chiamata upstream (sul prompt) e dopo di essa
(sulla risposta). Il Firewall scatta su ogni chiamata a tool che il modello
emette o che l’agent emette — indipendentemente dal modello o provider che ha
servito il turno.
4. Usa entrambi — i livelli di autonomia li impostano insieme
I Guardrails e il Firewall sono progettati per comporsi, non competere. Una
singola richiesta passa attraverso entrambi i piani:
Il guardrail in input gira — il testo del prompt viene filtrato e
opzionalmente mascherato.
Chiamata al modello — il prompt (possibilmente sanitizzato) raggiunge
il modello upstream.
Firewall — ogni chiamata a tool che il modello emette viene valutata.
Il guardrail in output gira — il testo della risposta del modello viene
filtrato.
Il modo più rapido per configurare entrambi in una volta è un livello di
autonomia — una singola impostazione che scrive atomicamente una policy del
Firewall e una policy dei Guardrails per l’intero workspace, con undo a un clic:
Applica un livello di autonomia dalla console del Firewall
(POST /api/workspace/firewall/autonomy, Developer+), poi ottimizza ciascun
piano indipendentemente da lì.
I Guardrails possiedono il testo; il Firewall possiede le azioni — eseguili
entrambi, lascia che il livello di autonomia li colleghi insieme, e irrigidisci
ciascun piano indipendentemente una volta che puoi vedere il traffico reale dei
tuoi agent.
Guardrails
Tipi di regola, rilevamento PII, LLM judge, harness di eval e riferimento
API.
Agent Firewall
Verdetti, superfici, livelli di autonomia, approvazione HITL e riferimento
API.