Przeglądaj dopasowania guardrail — strumień Matches

Powiązałeś guardrail i teraz chcesz zobaczyć, co wychwycił. Strumień Matches to log dopasowań guardrail OrcaRouter — za każdym razem, gdy reguła zadziała (block, mask, flag, annotate lub spotlight), brama rejestruje dopasowanie, które możesz przejrzeć w konsoli lub pobrać przez API. To sposób, w jaki odpowiadasz na “co reguła PII zredagowała wczoraj?”, “który klucz potyka się o bloker sekretów?” i “czy ta reguła działa na rzeczywistym ruchu, czy tylko szum?”. Ta strona to skupiony przewodnik po czytaniu i triażowaniu dopasowań. Jak reguły są autorowane i co każda akcja robi, zobacz referencję Guardrails.

1. Co rejestruje log dopasowań guardrail

Każda uruchomiona reguła zapisuje jedno dopasowanie do strumienia w zakresie przestrzeni roboczej (GET /api/guardrail/match, otwarty dla każdego Member). Strumień jest oddzielny od twojego logu żądań — przechowuje tylko to, co guardrail zrobił, nie pełne ciało żądania. Każde dopasowanie rejestruje:

Werdykt

rule_type (keyword, regex, pii, max_chars, external, llm_judge, grounding), efektywną action (block / mask / flag / annotate / spotlight) i stage (input lub output) — więc możesz natychmiast powiedzieć, co zadziałało i co zrobiło.

Gdzie zadziałało

guardrail_name, działająca rule_label plus kontekst żądania: model_name, token, na którym jechało, IP wywołującego ip i request_id, który łączy z powrotem do twojego logu żądań.

Łańcuch szczegółów

detail — krótka czytelna dla człowieka notatka silnika o naruszeniu (np. która encja lub wzorzec się potknął), zawsze rejestrowana.

Dopasowany podłańcuch — tylko gdy się zgodzisz

matched jest wypełniane tylko, gdy przełącznik Log raw content guardrail jest włączony. Jest domyślnie wyłączony, więc domyślnie strumień mówi ci, że reguła zadziałała i dlaczego, ale nigdy nie przechowuje samego wrażliwego łańcucha.

Surowa treść jest opt-in i nie działa wstecznie. Przy wyłączonym Log raw content (domyślnie) pole matched pozostaje puste — strumień rejestruje werdykt i detail, nigdy adres email, sekret czy PII, które potknęło regułę. Włącz to per guardrail tylko, gdy potrzebujesz podłańcucha do triażu; stosuje się do dopasowań zarejestrowanych po jego włączeniu. Zobacz Logowanie i prywatność.

2. Listuj i filtruj log dopasowań

Domyślny widok listy jest paginowany kursorem, najnowsze-pierwsze i w zakresie twojej przestrzeni roboczej. Zawęź go parametrami zapytania — konsola udostępnia je jako żetony filtrów:

Param	Filtruje po
`guardrail_id`, `rule_type`, `action`, `stage`	Werdykt
`token_id`, `model_name`, `request_id`	Kontekst żądania
`days` / `start_at` + `end_at`, `hide_fp`	Okno i stan fałszywie pozytywnych

Typowy odczyt “pokaż mi wszystko, co guardrail sekretów zablokował w tym tygodniu”, używając twojego tokenu sesji konsoli:

curl "https://api.orcarouter.ai/api/guardrail/match?guardrail_id=42&action=block&days=7" \
  -H "Authorization: Bearer <your-session-token>" \
  -H "X-Workspace-Id: <workspace-id>"

Trasy zarządzania jak /api/guardrail/* uwierzytelniają się twoją sesją / tokenem dostępu konsoli, nie kluczem relay. Klucze sk-orca-... służą wyłącznie do wywołań modelu /v1/*. W codziennym użyciu będziesz czytać strumień prosto z zakładki Matches na stronie Guardrails.

3. Grupuj po żądaniu

Pojedyncze żądanie może potknąć kilka reguł naraz — mask PII wejścia i limit max-length, powiedzmy. Widok pogrupowany (GET /api/guardrail/match/grouped, Member) zwija dopasowania po request_id, więc widzisz jeden wiersz na obraźliwe żądanie z jego dopasowaniami złożonymi inline, zamiast przewijać pięć wierszy dla tego samego wywołania. Dostrój, ile dopasowań pokazuje się inline na grupę, przez inline_limit (domyślnie 5).

4. Statystyki i pasek trendu

Endpoint statystyk (GET /api/guardrail/match/stats, Member) zasila pasek liczników i wykres na zakładce Matches — sumy w oknie days, opcjonalnie rozbite przez group_by:

`group_by`	Rozbicie
(pominięte)	Tylko sumy
`rule_type`	Które typy reguł działają najczęściej
`guardrail_id`	Który guardrail odpowiada za aktywność

Przekaż request_id, by dostać liczbę dopasowań w stałym czasie dla jednego żądania (używane przez krzyżowy link logu żądań). To tam żyją użycie per-guardrail, miks akcji i wskaźnik fałszywie pozytywnych — kroj to, a nie przeglądaj surową listę.

5. Eksportuj na ślad audytu

Gdy potrzebujesz dopasowań poza konsolą — pakiet dowodowy, arkusz kalkulacyjny, SIEM poniżej — GET /api/guardrail/match/export (Member) strumieniuje twój bieżący zestaw filtrów jako CSV lub JSON:

curl "https://api.orcarouter.ai/api/guardrail/match/export?format=csv&guardrail_id=42&days=30" \
  -H "Authorization: Bearer <your-session-token>" \
  -H "X-Workspace-Id: <workspace-id>" \
  -o guardrail-matches.csv

Eksport niesie te same kolumny, które strumień rejestruje — czas, guardrail, typ i etykietę reguły, etap, akcję, model, token, szczegół, dopasowany podłańcuch (tylko jeśli przechwytywanie surowej treści było włączone w czasie rejestracji), id żądania, ip i znacznik czasu fałszywie pozytywnego.

CSV jest bezpieczny wobec injection formuł: każda komórka, która inaczej zostałaby odczytana jako formuła arkusza, jest neutralizowana, więc otwarcie eksportu w Excelu lub Sheets nie może wykonać payloadu przemyconego przez dopasowany podłańcuch.

6. Triażuj fałszywie pozytywne

Nie każde dopasowanie to prawdziwe trafienie. Gdy reguła działa na łagodnym ruchu, Admin przestrzeni roboczej może oznaczyć dopasowanie jako fałszywie pozytywne (POST /api/guardrail/match/:id/mark-fp); odwrotne DELETE /api/guardrail/match/:id/mark-fp je odznacza. Oznaczanie jest tylko dla Admin, mimo że reszta strumienia jest czytelna dla Member — triaż to uprzywilejowana akcja. Oznaczenie fałszywie pozytywnego robi dwie rzeczy: taguje dopasowanie (więc hide_fp=true filtruje je ze strumienia) i zapamiętuje ustalenie, więc ta sama reguła na tej samej treści jest pomijana w przyszłych żądaniach. Odznacz, by przywrócić egzekwowanie. Po szerszy przepływ strojenia hałaśliwej reguły zobacz Strojenie fałszywie pozytywnych.

Dopasowanie to dane diagnostyczne, nie decyzja egzekwowania. Czy żądanie zostało zablokowane, zamaskowane czy jedynie oflagowane, jest już rozstrzygnięte przez akcję w czasie żądania — strumień to zapis po fakcie. Oznaczenie fałszywie pozytywnego zmienia przyszłe zachowanie, nigdy wywołanie, które już się wydarzyło.

7. Skąd biorą się dopasowania

Dopasowania są produkowane przez silnik guardrail na ścieżce relay, więc strumień odzwierciedla dokładnie to, co zrobiły twoje powiązane polityki:

Dopasowania na etapie wejścia rejestrują to, co brama sprawdziła przed tym, jak model to zobaczył — zobacz Etap wejścia.
Dopasowania na etapie wyjścia rejestrują to, co sprawdziła na odpowiedzi — zobacz Etap wyjścia.
Zablokowane żądanie pojawia się też jako HTTP 400 guardrail_blocked dla wywołującego; dopasowanie to jego zapis po stronie serwera.

Jeśli żaden guardrail nie rozwiąże się na żądaniu, nic nie jest sprawdzane i nic nie ląduje w strumieniu — zachowanie jest identyczne z przestrzenią roboczą, która nigdy nie włączyła tej funkcji. Zobacz Powiąż z kluczem i Domyślny dla konta, jak polityka w ogóle staje przed ruchem.

8. Powiązane

Referencja Guardrails

Pełny silnik: typy reguł, etapy, akcje, presety, harness ewaluacyjny.

Logowanie i prywatność

Przełącznik Log raw content i co strumień przechowuje — a czego nie.

Strojenie fałszywie pozytywnych

Użyj strumienia, by znaleźć i wyciszyć hałaśliwe reguły bez osłabiania polityki.

Wersjonowanie

Porównaj i wycofaj guardrail, gdy strumień pokaże, że zmiana wypaliła źle.

Po większy obraz tego, jak brama inspekcjonuje ruch, zobacz Jak OrcaRouter inspekcjonuje i Guardrails vs firewall.

​1. Co rejestruje log dopasowań guardrail

​2. Listuj i filtruj log dopasowań

​3. Grupuj po żądaniu

​4. Statystyki i pasek trendu

​5. Eksportuj na ślad audytu

​6. Triażuj fałszywie pozytywne

​7. Skąd biorą się dopasowania

​8. Powiązane

Referencja Guardrails

Logowanie i prywatność

Strojenie fałszywie pozytywnych

Wersjonowanie

1. Co rejestruje log dopasowań guardrail

2. Listuj i filtruj log dopasowań

3. Grupuj po żądaniu

4. Statystyki i pasek trendu

5. Eksportuj na ślad audytu

6. Triażuj fałszywie pozytywne

7. Skąd biorą się dopasowania

8. Powiązane