1. Co rejestruje log dopasowań guardrail
Każda uruchomiona reguła zapisuje jedno dopasowanie do strumienia w zakresie przestrzeni roboczej (GET /api/guardrail/match, otwarty dla każdego
Member). Strumień jest oddzielny od twojego logu żądań — przechowuje tylko
to, co guardrail zrobił, nie pełne ciało żądania. Każde dopasowanie rejestruje:
Werdykt
Werdykt
rule_type (keyword, regex, pii, max_chars, external,
llm_judge, grounding), efektywną action (block / mask / flag /
annotate / spotlight) i stage (input lub output) — więc możesz
natychmiast powiedzieć, co zadziałało i co zrobiło.Gdzie zadziałało
Gdzie zadziałało
guardrail_name, działająca rule_label plus kontekst żądania:
model_name, token, na którym jechało, IP wywołującego ip i
request_id, który łączy z powrotem do twojego logu żądań.Łańcuch szczegółów
Łańcuch szczegółów
detail — krótka czytelna dla człowieka notatka silnika o naruszeniu
(np. która encja lub wzorzec się potknął), zawsze rejestrowana.Dopasowany podłańcuch — tylko gdy się zgodzisz
Dopasowany podłańcuch — tylko gdy się zgodzisz
matched jest wypełniane tylko, gdy przełącznik Log raw content
guardrail jest włączony. Jest domyślnie wyłączony, więc domyślnie strumień
mówi ci, że reguła zadziałała i dlaczego, ale nigdy nie przechowuje samego
wrażliwego łańcucha.2. Listuj i filtruj log dopasowań
Domyślny widok listy jest paginowany kursorem, najnowsze-pierwsze i w zakresie twojej przestrzeni roboczej. Zawęź go parametrami zapytania — konsola udostępnia je jako żetony filtrów:| Param | Filtruje po |
|---|---|
guardrail_id, rule_type, action, stage | Werdykt |
token_id, model_name, request_id | Kontekst żądania |
days / start_at + end_at, hide_fp | Okno i stan fałszywie pozytywnych |
Trasy zarządzania jak
/api/guardrail/* uwierzytelniają się twoją sesją /
tokenem dostępu konsoli, nie kluczem relay. Klucze sk-orca-... służą
wyłącznie do wywołań modelu /v1/*. W codziennym użyciu będziesz czytać
strumień prosto z zakładki Matches na stronie Guardrails.3. Grupuj po żądaniu
Pojedyncze żądanie może potknąć kilka reguł naraz — mask PII wejścia i limit max-length, powiedzmy. Widok pogrupowany (GET /api/guardrail/match/grouped, Member) zwija dopasowania po
request_id, więc widzisz jeden wiersz na obraźliwe żądanie z jego
dopasowaniami złożonymi inline, zamiast przewijać pięć wierszy dla tego samego
wywołania. Dostrój, ile dopasowań pokazuje się inline na grupę, przez
inline_limit (domyślnie 5).
4. Statystyki i pasek trendu
Endpoint statystyk (GET /api/guardrail/match/stats, Member) zasila pasek
liczników i wykres na zakładce Matches — sumy w oknie days, opcjonalnie
rozbite przez group_by:
group_by | Rozbicie |
|---|---|
| (pominięte) | Tylko sumy |
rule_type | Które typy reguł działają najczęściej |
guardrail_id | Który guardrail odpowiada za aktywność |
request_id, by dostać liczbę dopasowań w stałym czasie dla jednego
żądania (używane przez krzyżowy link logu żądań). To tam żyją użycie
per-guardrail, miks akcji i wskaźnik fałszywie pozytywnych — kroj to, a nie
przeglądaj surową listę.
5. Eksportuj na ślad audytu
Gdy potrzebujesz dopasowań poza konsolą — pakiet dowodowy, arkusz kalkulacyjny, SIEM poniżej —GET /api/guardrail/match/export (Member)
strumieniuje twój bieżący zestaw filtrów jako CSV lub JSON:
6. Triażuj fałszywie pozytywne
Nie każde dopasowanie to prawdziwe trafienie. Gdy reguła działa na łagodnym ruchu, Admin przestrzeni roboczej może oznaczyć dopasowanie jako fałszywie pozytywne (POST /api/guardrail/match/:id/mark-fp); odwrotne
DELETE /api/guardrail/match/:id/mark-fp je odznacza. Oznaczanie jest tylko
dla Admin, mimo że reszta strumienia jest czytelna dla Member — triaż to
uprzywilejowana akcja.
Oznaczenie fałszywie pozytywnego robi dwie rzeczy: taguje dopasowanie (więc
hide_fp=true filtruje je ze strumienia) i zapamiętuje ustalenie, więc ta
sama reguła na tej samej treści jest pomijana w przyszłych żądaniach. Odznacz,
by przywrócić egzekwowanie. Po szerszy przepływ strojenia hałaśliwej reguły
zobacz Strojenie fałszywie pozytywnych.
Dopasowanie to dane diagnostyczne, nie decyzja egzekwowania. Czy żądanie
zostało zablokowane, zamaskowane czy jedynie oflagowane, jest już rozstrzygnięte
przez akcję w czasie żądania — strumień to
zapis po fakcie. Oznaczenie fałszywie pozytywnego zmienia przyszłe
zachowanie, nigdy wywołanie, które już się wydarzyło.
7. Skąd biorą się dopasowania
Dopasowania są produkowane przez silnik guardrail na ścieżce relay, więc strumień odzwierciedla dokładnie to, co zrobiły twoje powiązane polityki:- Dopasowania na etapie wejścia rejestrują to, co brama sprawdziła przed tym, jak model to zobaczył — zobacz Etap wejścia.
- Dopasowania na etapie wyjścia rejestrują to, co sprawdziła na odpowiedzi — zobacz Etap wyjścia.
- Zablokowane żądanie pojawia się też jako
HTTP 400
guardrail_blockeddla wywołującego; dopasowanie to jego zapis po stronie serwera.
8. Powiązane
Referencja Guardrails
Pełny silnik: typy reguł, etapy, akcje, presety, harness ewaluacyjny.
Logowanie i prywatność
Przełącznik Log raw content i co strumień przechowuje — a czego nie.
Strojenie fałszywie pozytywnych
Użyj strumienia, by znaleźć i wyciszyć hałaśliwe reguły bez osłabiania polityki.
Wersjonowanie
Porównaj i wycofaj guardrail, gdy strumień pokaże, że zmiana wypaliła źle.
