Vai al contenuto principale
Questo è il percorso più rapido da un agent non protetto a una postura zero-trust. Applichi un solo switch, continui a chiamare il gateway esattamente come prima, guardi cosa fa davvero il tuo agent, e poi irrigidisci. Nessuna regola da scrivere, nessuna modifica all’SDK.
Applicare una postura di sicurezza modifica un’impostazione del workspace, quindi gli step 2 e 5 richiedono il ruolo Developer. Il feed Matches del guardrail (step 4) è aperto a qualsiasi membro; il feed Events del firewall richiede anche Developer.

Attivalo in 5 passi

1

Ottieni una chiave API

Se non ne hai ancora una, crea una chiave — vedi Ottieni una chiave API. Dai questa chiave all’agent che vuoi proteggere. Tutto quello che segue si collega al tuo workspace, quindi la stessa postura copre ogni chiave in esso.
2

Applica il baseline Secure Agents

Nella console, apri Firewall → Posture e applica il livello di autonomia balanced (ruolo Developer).In una transazione questo imposta sia la postura del tuo Firewall che dei Guardrails: le chiamate a tool vengono auditate e le PII vengono segnalate, mentre le azioni più distruttive (come la shell distruttiva) vengono negate — così osservi prima di applicare in modo esteso. È un singolo switch con undo a un clic. (Per un passo che non blocca nulla, parti da permissive.)
3

Invia una richiesta esattamente come prima

Nulla della tua chiamata cambia. Usa la stessa chiave, lo stesso formato OpenAI:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Summarize my notes and email me at jane@acme.com"}
    ]
  }'
La richiesta passa. Sotto balanced non viene bloccata — viene osservata. L’email viene segnalata, e qualsiasi chiamata a tool che il tuo agent fa viene registrata.
4

Guarda cosa ha fatto davvero il tuo agent

Due feed, entrambi con scope a livello di workspace:
  • Firewall → Events / Runs — ogni chiamata a tool che il tuo agent ha fatto, il suo verdetto, e quale superficie ha colpito (il tool che ha pubblicizzato, la chiamata che il modello ha emesso, un dispatch MCP, o una destinazione in uscita).
  • Guardrails → Matches — ogni regola che ha scattato, come l’email segnalata, raggruppata per guardrail e azione.
Questo è il valore dell’osservare prima: vedi il comportamento reale del tuo agent prima che qualsiasi regola possa romperlo.
5

Irrigidisci per applicare

Una volta che i feed sembrano corretti, cambia il livello di autonomia su tight sulla stessa pagina Firewall → Posture (ruolo Developer).Ora l’applicazione è in tempo reale: le PII vengono mascherate prima che il modello le veda, i segreti vengono bloccati dalle tue richieste, e le chiamate alla shell distruttiva e l’egress SSRF vengono negati. Una chiamata a tool negata torna come HTTP 400 firewall_blocked; un prompt bloccato torna come HTTP 400 guardrail_blocked — e un block non ti costa quota. Nessuna modifica all’applicazione — la richiesta successiva è governata.
Questo è il zero trust attivo: ogni prompt e risposta filtrati, ogni chiamata a tool e richiesta in uscita instradata governata, ogni decisione loggata.

Cosa hai appena attivato

LayerSotto balancedSotto tight
Guardrails (testo)PII segnalata (solo-audit)PII mascherata, segreti bloccati
Firewall (azioni)Auditato; shell distruttiva negataDefault-deny; shell distruttiva + egress SSRF negati
VisibilitàCompleta — Events + MatchesCompleta — Events + Matches

Troppo restrittivo?

Ogni modifica di autonomia è una transazione con undo a un clic, così puoi tornare direttamente alla tua postura precedente dalla pagina Firewall (o dall’API di undo). Puoi anche semplicemente riapplicare un livello più morbido (balanced o permissive) in qualsiasi momento.

Prossimi passi

Il baseline Secure Agents

Cosa imposta ogni livello di autonomia, e come simulare prima di applicare.

Modalità di applicazione

Observe → shadow → enforce, il rollout sicuro in dettaglio.

Guardrails

Scrivi le tue regole di contenuto oltre il baseline.

Agent Firewall

Scrivi allowlist dei tool, controlli sugli argomenti e regole di egress.