Quickstart: attiva il zero trust in 5 minuti

Questo è il percorso più rapido da un agent non protetto a una postura zero-trust. Applichi un solo switch, continui a chiamare il gateway esattamente come prima, guardi cosa fa davvero il tuo agent, e poi irrigidisci. Nessuna regola da scrivere, nessuna modifica all’SDK.

Applicare una postura di sicurezza modifica un’impostazione del workspace, quindi gli step 2 e 5 richiedono il ruolo Developer. Il feed Matches del guardrail (step 4) è aperto a qualsiasi membro; il feed Events del firewall richiede anche Developer.

Attivalo in 5 passi

Ottieni una chiave API

Se non ne hai ancora una, crea una chiave — vedi Ottieni una chiave API. Dai questa chiave all’agent che vuoi proteggere. Tutto quello che segue si collega al tuo workspace, quindi la stessa postura copre ogni chiave in esso.

Applica il baseline Secure Agents

Nella console, apri Firewall → Posture e applica il livello di autonomia balanced (ruolo Developer).In una transazione questo imposta sia la postura del tuo Firewall che dei Guardrails: le chiamate a tool vengono auditate e le PII vengono segnalate, mentre le azioni più distruttive (come la shell distruttiva) vengono negate — così osservi prima di applicare in modo esteso. È un singolo switch con undo a un clic. (Per un passo che non blocca nulla, parti da permissive.)

Invia una richiesta esattamente come prima

Nulla della tua chiamata cambia. Usa la stessa chiave, lo stesso formato OpenAI:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Summarize my notes and email me at jane@acme.com"}
    ]
  }'

La richiesta passa. Sotto balanced non viene bloccata — viene osservata. L’email viene segnalata, e qualsiasi chiamata a tool che il tuo agent fa viene registrata.

Guarda cosa ha fatto davvero il tuo agent

Due feed, entrambi con scope a livello di workspace:

Firewall → Events / Runs — ogni chiamata a tool che il tuo agent ha fatto, il suo verdetto, e quale superficie ha colpito (il tool che ha pubblicizzato, la chiamata che il modello ha emesso, un dispatch MCP, o una destinazione in uscita).
Guardrails → Matches — ogni regola che ha scattato, come l’email segnalata, raggruppata per guardrail e azione.

Questo è il valore dell’osservare prima: vedi il comportamento reale del tuo agent prima che qualsiasi regola possa romperlo.

Irrigidisci per applicare

Una volta che i feed sembrano corretti, cambia il livello di autonomia su tight sulla stessa pagina Firewall → Posture (ruolo Developer).Ora l’applicazione è in tempo reale: le PII vengono mascherate prima che il modello le veda, i segreti vengono bloccati dalle tue richieste, e le chiamate alla shell distruttiva e l’egress SSRF vengono negati. Una chiamata a tool negata torna come HTTP 400 firewall_blocked; un prompt bloccato torna come HTTP 400 guardrail_blocked — e un block non ti costa quota. Nessuna modifica all’applicazione — la richiesta successiva è governata.

Questo è il zero trust attivo: ogni prompt e risposta filtrati, ogni chiamata a tool e richiesta in uscita instradata governata, ogni decisione loggata.

Cosa hai appena attivato

Layer	Sotto `balanced`	Sotto `tight`
Guardrails (testo)	PII segnalata (solo-audit)	PII mascherata, segreti bloccati
Firewall (azioni)	Auditato; shell distruttiva negata	Default-deny; shell distruttiva + egress SSRF negati
Visibilità	Completa — Events + Matches	Completa — Events + Matches

Troppo restrittivo?

Ogni modifica di autonomia è una transazione con undo a un clic, così puoi tornare direttamente alla tua postura precedente dalla pagina Firewall (o dall’API di undo). Puoi anche semplicemente riapplicare un livello più morbido (balanced o permissive) in qualsiasi momento.

Prossimi passi

Il baseline Secure Agents

Cosa imposta ogni livello di autonomia, e come simulare prima di applicare.

Modalità di applicazione

Observe → shadow → enforce, il rollout sicuro in dettaglio.

Guardrails

Scrivi le tue regole di contenuto oltre il baseline.

Agent Firewall

Scrivi allowlist dei tool, controlli sugli argomenti e regole di egress.

Baseline Secure Agents Responsabilità condivisa

​Attivalo in 5 passi

​Cosa hai appena attivato

​Troppo restrittivo?

​Prossimi passi

Il baseline Secure Agents

Modalità di applicazione

Guardrails

Agent Firewall

Attivalo in 5 passi

Cosa hai appena attivato

Troppo restrittivo?

Prossimi passi