1. Cosa registra il log dei match dei guardrail
Ogni regola scattata scrive un match in un feed con scope a livello di workspace (GET /api/guardrail/match, aperto a qualsiasi Member). Il feed è separato dal
tuo request log — memorizza solo cosa ha fatto un guardrail, non il corpo completo
della richiesta. Ogni match registra:
Il verdetto
Il verdetto
rule_type (keyword, regex, pii, max_chars, external,
llm_judge, grounding), l’action effettiva (block / mask /
flag / annotate / spotlight), e lo stage (input o output) — così
puoi capire istantaneamente cosa è scattato e cosa ha fatto.Dove è scattato
Dove è scattato
guardrail_name, il rule_label che ha scattato, più il contesto della
richiesta: model_name, il token su cui è arrivato, l’ip del chiamante e
il request_id che riconnette al tuo request log.Una stringa di detail
Una stringa di detail
detail — la breve nota leggibile dall’uomo del motore per la violazione (es.
quale entità o pattern ha fatto scattare), sempre registrata.La sottostringa corrispondente — solo quando opti per essa
La sottostringa corrispondente — solo quando opti per essa
matched è popolato solo quando il toggle Log raw content del
guardrail è attivo. È disattivato per default, quindi per default il feed ti
dice che una regola è scattata e perché, ma non memorizza mai la stringa
sensibile stessa.2. Elenca e filtra il log dei match
La vista di elenco di default è paginata a cursore, dalla più recente, e con scope al tuo workspace. Restringila con query param — la console li espone come chip di filtro:| Param | Filtra per |
|---|---|
guardrail_id, rule_type, action, stage | Il verdetto |
token_id, model_name, request_id | Il contesto della richiesta |
days / start_at + end_at, hide_fp | Finestra e stato di falso positivo |
Le rotte di management come
/api/guardrail/* si autenticano con il tuo session
/ access token della console, non con una chiave di relay. Le chiavi
sk-orca-... servono solo per le chiamate al modello /v1/*. Nell’uso quotidiano
leggerai il feed direttamente dalla tab Matches sulla pagina Guardrails.3. Raggruppa per richiesta
Una singola richiesta può far scattare diverse regole contemporaneamente — un mask PII di input e un limite di max-length, diciamo. La vista raggruppata (GET /api/guardrail/match/grouped, Member) collassa i match per request_id così
che tu veda una riga per richiesta incriminata con i suoi match ripiegati inline,
invece di scorrere cinque righe per la stessa chiamata. Regola quanti match si
mostrano inline per gruppo con inline_limit (default 5).
4. Stats e la striscia di trend
L’endpoint delle stats (GET /api/guardrail/match/stats, Member) alimenta la
striscia di conteggio e il grafico sulla tab Matches — totali su una finestra
days, opzionalmente suddivisi con group_by:
group_by | Suddivisione |
|---|---|
| (omesso) | Solo totali |
rule_type | Quali tipi di regola scattano di più |
guardrail_id | Quale guardrail rende conto dell’attività |
request_id per ottenere un conteggio di match a tempo costante per una
richiesta (usato dal cross-link del request-log). È qui che vivono l’utilizzo per
guardrail, il mix di azioni e il tasso di falsi positivi — suddividilo anziché
paginare l’elenco grezzo.
5. Esporta per una traccia di audit
Quando ti servono i match fuori dalla console — un pacchetto di evidenze, un foglio di calcolo, un SIEM a valle —GET /api/guardrail/match/export (Member) streama il
tuo set di filtri corrente come CSV o JSON:
6. Triage dei falsi positivi
Non ogni match è un hit reale. Quando una regola scatta sul traffico benigno, un Admin del workspace può segnare il match come falso positivo (POST /api/guardrail/match/:id/mark-fp); l’inverso
DELETE /api/guardrail/match/:id/mark-fp lo desegna. La segnalazione è solo
Admin anche se il resto del feed è leggibile dai Member — il triage è un’azione
privilegiata.
Segnare un falso positivo fa due cose: etichetta il match (così hide_fp=true lo
filtra fuori dal feed) e ricorda il finding così che la stessa regola sullo stesso
contenuto venga saltata nelle richieste future. Desegna per ripristinare
l’applicazione. Per il workflow più ampio di mettere a punto una regola rumorosa,
vedi Tuning dei falsi positivi.
Un match è dato diagnostico, non una decisione di applicazione. Se una
richiesta è stata bloccata, mascherata o solo segnalata è già stabilito
dall’azione al momento della richiesta — il feed
è il record a posteriori. Segnare un falso positivo cambia il comportamento
futuro, mai la chiamata già avvenuta.
7. Da dove vengono i match
I match sono prodotti dal motore di guardrail sul percorso di relay, quindi il feed riflette esattamente ciò che le tue policy collegate hanno fatto:- I match dello stage di input registrano cosa il gateway ha filtrato prima che il modello lo vedesse — vedi Stage di input.
- I match dello stage di output registrano cosa ha filtrato sulla risposta — vedi Stage di output.
- Una richiesta bloccata emerge anche come un
HTTP 400
guardrail_blockedal chiamante; il match è il record lato server di esso.
8. Correlati
Riferimento Guardrails
Il motore completo: tipi di regola, stage, azioni, preset, harness di eval.
Logging e privacy
Il toggle Log raw content e cosa il feed memorizza — e non memorizza.
Tuning dei falsi positivi
Usa il feed per trovare e silenziare le regole rumorose senza indebolire la
policy.
Versioning
Confronta e fai il revert di un guardrail quando il feed mostra che una modifica
ha mancato il bersaglio.
