Ogni passaggio qui è un’azione di console sul gateway gestito
(
api.orcarouter.ai). La configurazione dei guardrail gira sotto la tua
sessione; solo la chiamata /v1/* finale usa una chiave di relay
sk-orca-.... Creare e modificare guardrails richiede Developer+ nel
workspace.1. Come aggiungere guardrails LLM in cinque passi
Ecco l’intero loop a colpo d’occhio — ogni passo è ampliato sotto.Crea un guardrail
Nella console, apri Guardrails e fai clic su New guardrail. Dagli
un nome (≤ 64 caratteri), es.
pii-shield.Testala nella sandbox
Apri la tab Test, incolla un campione ed esegui la policy localmente —
nessuna chiamata upstream, nessuna quota.
Collegala a una chiave
Modifica una chiave API e scegli il guardrail dal menu a tendina
Guardrail. Il binding vive sulla chiave.
2. Crea il guardrail
Nella console, apri Guardrails e fai clic su New guardrail. Un guardrail è una content policy nominata, con scope a livello di workspace — un elenco ordinato di regole che il gateway esegue sull’input della richiesta e sull’output del modello. Chiamalopii-shield e salva.
3. Aggiungi una regola
Ogni regola decide tre cose — cosa cercare (un tipo di regola), dove cercare (uno stage) e cosa fare (un’azione). Aggiungi una regola:- Type: PII detection (
pii) - Stage: Input (la richiesta)
- Action: Mask — redige il match
- Entities:
email,phone,ssn
[EMAIL], un SSN diventa [SSN]. I sette tipi di regola
(keyword, regex, pii, max_chars, external, llm_judge,
grounding) e le cinque azioni (block, mask, flag, annotate,
spotlight) sono coperti nel
riferimento. Per questo primo guardrail,
una regola di masking è sufficiente.
Il masking è attivo su entrambi gli stage. Le regole dello stage di input
mascherano la richiesta prima che il modello la veda; le regole dello stage di
output mascherano la risposta del modello — sulle risposte non in streaming e
chunk-per-chunk su quelle in streaming — prima che il client la riceva.
Block è applicato su entrambi gli stage. Se vuoi gestire le risposte del
modello, imposta lo stage della regola su
output (o both); vedi
Regole dello stage di output.4. Testala nella sandbox
Prima di collegare il guardrail a qualsiasi chiave, dimostra che fa ciò che ti aspetti. Apri la tab Test all’interno dell’editor, incolla un campione, scegli lo stageinput ed esegui:
5. Collegala a una chiave
Un guardrail non fa nulla finché una chiave non punta a esso. Due modi per legarlo:Per chiave
Modifica una chiave API e scegli il guardrail dal menu a tendina
Guardrail. Questo imposta
guardrail_id sulla chiave. Vedi
Collega a una chiave.Default del workspace
Marca il guardrail come default del workspace così che ogni chiave senza
un collegamento esplicito lo erediti. Vedi
Default di account.
| Ordine | Cosa si applica |
|---|---|
| 1 | Il guardrail_id esplicito della chiave (se esiste ed è abilitato). |
| 2 | Il default del workspace (se la chiave non ha collegamento). |
| 3 | Nessuno — la richiesta è byte-identica a un workspace senza policy. |
6. Invia una richiesta
Usando una chiave legata apii-shield, chiama OrcaRouter esattamente come
prima — nessuna modifica all’SDK, nessun nuovo header:
[EMAIL] prima di inoltrare — il modello
upstream non vede mai l’indirizzo. Cambia l’azione della regola in block e
la richiesta immediatamente successiva che contiene l’entità viene rifiutata
con HTTP 400 guardrail_blocked. Una richiesta bloccata non costa quota
(un block di input scatta prima della misurazione; un block di output rimborsa
la quota pre-consumata) ed è marcata skip-retry. Vedi l’
errore guardrail_blocked
per la forma completa della risposta.
7. Dove andare dopo
Vedi cosa è scattato
Vedi cosa è scattato
Ogni regola che scatta registra un match — type, action, stage e una
stringa di detail. La sottostringa corrispondente viene registrata solo
quando Log raw content è attivo (disattivato per default). Vedi il
Feed dei match e
Logging e privacy.
Maschera più delle basi
Maschera più delle basi
La PII detection copre
email, phone, credit_card, ssn, ip,
iban, mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address (più le entità regionali), e puoi scrivere le tue. Vedi
PII Shield,
Entità PII personalizzate e
Formati di masking.Cattura segreti e injection
Cattura segreti e injection
Aggiungi un blocker di segreti o il
preset basi di prompt-injection
— quest’ultimo segnala frasi di jailbreak comuni per la review. Per catturare
l’intento di injection in modo semantico anziché per frase, aggiungi una
regola
llm_judge accanto a esso.Fai il rollback di una modifica
Fai il rollback di una modifica
Ogni modifica scrive una riga di cronologia versionata. Apri History per
confrontare e ripristinare. Vedi Versioning.
Gestisci le chiamate a tool, non solo il testo
Gestisci le chiamate a tool, non solo il testo
I guardrails filtrano il contenuto. Per governare le chiamate a tool di un
agent — negare azioni distruttive, limitare il costo, richiedere approvazione
— usa il Firewall. Parti da
Proteggere gli agent AI e dalla
minaccia delle chiamate a tool pericolose.
