Blokuj wyciek sekretów i poświadczeń

Prompt niosący klucz AKIA..., wklejony .env, agent odbijający własny token sk-... — każde z nich może wysłać żywe poświadczenie do OpenAI, Anthropic czy Google w postaci jawnej, gdzie ląduje w ich logach i twoich. Secrets Blocker zatrzymuje to na bramie: preset guardrail jednym kliknięciem, który skanuje żądanie pod kątem kształtów poświadczeń i odrzuca wywołanie z HTTP 400, zanim jeden bajt opuści twoją bramę. To skupiona strona docelowa dla przypadku wycieku sekretów. Pełny silnik guardrail — każdy typ reguły, pole i trasę — znajdziesz w referencji Guardrails.

1. Zapobiegaj przepływom wycieku klucza API LLM jednym presetem

Całym sednem orurowania prevent api key leak llm jest wychwycenie poświadczenia przed wywołaniem w górę, nie po tym, jak już jest w logu żądań dostawcy. Preset Secrets Blocker robi dokładnie to. To mały guardrail złożony z reguł block na etapie wejścia, każda regex dla dobrze znanego kształtu poświadczenia:

Klucz dostępu AWS

AKIA poprzedzone 16 znakami wielkoliterowo-alfanumerycznymi — kanoniczny kształt access-key-id AWS.

Klucz sekretny w stylu OpenAI

Prefiks sk- poprzedzony długim ciałem tokenu — kształt używany przez OpenAI i kilka podobnych kluczy dostawców.

Osobisty token dostępu GitHub

Prefiks ghp_ poprzedzony 36-znakowym ciałem.

Gdy jakakolwiek reguła się dopasuje, żądanie jest zablokowane — brama nigdy go nie przesyła. Polityka żyje w bramie, nie w twojej aplikacji, więc twoja aplikacja dalej woła /v1/chat/completions dokładnie jak wcześniej, bez zmiany SDK i bez ponownego wdrożenia.

Etap wejścia, przed pomiarem. Secrets Blocker sprawdza to, co wysyłasz. Dopasowanie odrzuca wywołanie, zanim model jest wywołany, więc poświadczenie nigdy nie dociera do dostawcy, a zablokowane żądanie nie kosztuje żadnej kwoty. Aby wychwycić też sekret, który model emituje z powrotem do klienta, sparuj go z presetem block wyjścia — zobacz §5.

2. Zastosuj preset w konsoli

Każdy krok tutaj to akcja konsoli na hostowanej bramie pod twoją własną sesją. Tworzenie i edycja guardrails wymaga Developer+ w przestrzeni roboczej. Tylko końcowe wywołanie /v1/* używa klucza relay sk-orca-....

Otwórz szablon

W konsoli otwórz Guardrails, kliknij przycisk z podziałem New guardrail i wybierz Secrets & API-Key Blocker z kategorii szablonów Secrets. Zasiewa reguły block na etapie wejścia.

Nazwij i zapisz

Nadaj mu nazwę (≤ 64 znaki), np. secrets-blocker, i zapisz. Preset to ziarno, nie blokada — dodawaj lub edytuj reguły swobodnie potem (zobacz §4).

Przetestuj

Otwórz zakładkę Test, wklej przykładowe poświadczenie na etapie input i uruchom politykę lokalnie — bez wywołania w górę, bez kwoty (zobacz §3).

Powiąż klucz

Edytuj klucz API i wybierz secrets-blocker z rozwijanej listy Guardrail (ustawia guardrail_id na kluczu) lub oznacz go jako domyślny przestrzeni roboczej. Zobacz Powiąż z kluczem i Domyślny dla konta.

3. Przetestuj, zanim powiążesz

Udowodnij, że reguła działa, zanim jakikolwiek klucz na nią wskaże. Otwórz zakładkę Test wewnątrz edytora, wklej atrapę poświadczenia, wybierz etap input i uruchom:

Here is my key: AKIAIOSFODNN7EXAMPLE

Piaskownica ewaluuje bieżącą politykę lokalnie — nic nie jest wysyłane w górę, nic mierzone — i zwraca werdykt block nazywający regułę, która zadziałała. Po siatkę A/B wobec korpusu próbek wyciekłych sekretów i łagodnych harness ewaluacyjny mieszka o jedną zakładkę dalej.

4. Rozszerz pokrycie

Secrets Blocker obejmuje trzy kształty o największym ruchu. Kategoria Secrets dostarcza siostrzane presety, które możesz zastosować obok niego, a możesz autorzyć własną regułę regex dla dowolnego tokenu, który twój stos wystawia:

Private Keys & Cloud Tokens

Towarzyszący preset Secrets, który blokuje klucze prywatne PEM, tokeny Slack i Stripe, klucze API Google i JWT na żądaniu.

Crypto Wallet Block

Blokuje adresy portfeli w stylu BTC i ETH na żądaniu, gdy nigdy nie powinny dotrzeć do dostawcy.

Aby dopasować wewnętrzny format tokenu, dodaj regułę regex — wzorce RE2, liniowy czas, bez backreferencji — na etapie input z akcją block. Złe wzorce są odrzucane przy zapisie, więc guardrail, który możesz zapisać, zawsze się kompiluje.

Zamiast blokować, chcesz zredagować wyciekły sekret i przepuścić żądanie oczyszczone? Użyj reguły pii z akcją mask — wbudowany zestaw detektorów obejmuje aws_access_key, api_key_openai i jwt, każdy renderujący się do typowanego tagu jak [AWS_ACCESS_KEY]. Zobacz Akcje po block vs. mask.

5. Wychwyć też sekrety w odpowiedzi

Secrets Blocker sprawdza żądanie. Osobny preset Secrets, Code Secret in Output, sprawdza odpowiedź modelu pod kątem kluczy prywatnych i tokenów w stylu AWS/OpenAI i blokuje wywołanie, jeśli jeden wycieknie z powrotem. Block wyjścia jest egzekwowany w obie strony: na odpowiedzi nie-streamingowej odpowiedź jest sprawdzana, zanim wróci, a na odpowiedzi streamingowej skaner przecina strumień, zanim jakakolwiek zablokowana treść dotrze do klienta. Blokada na etapie wyjścia zwraca wstępnie pobraną kwotę. Zobacz Reguły na etapie wyjścia i Pokrycie streamingu.

6. Jak wygląda blokada

Zablokowane żądanie zwraca HTTP 400 z kodem błędu guardrail_blocked i komunikatem nazywającym guardrail oraz regułę, która zadziałała:

{
  "error": {
    "code": "guardrail_blocked",
    "message": "request blocked by guardrail \"secrets-blocker\": regex(...)"
  }
}

Żądanie nie kosztuje kwoty — blokada na etapie wejścia działa przed pomiarem — i jest oznaczone jako skip-retry, bo ponowne uruchomienie tego samego promptu na innym kanale po prostu znów by zablokowało. Zobacz błąd guardrail_blocked.

7. Zobacz, co zadziałało

Każda reguła, która zadziała, rejestruje dopasowanie — typ reguły, akcję, etap i łańcuch szczegółów — pokazane w strumieniu Matches przestrzeni roboczej. Sam dopasowany podłańcuch (poświadczenie) jest rejestrowany tylko, gdy Log raw content jest włączone, co jest domyślnie wyłączone.

Dla kontroli sekretów pozostawienie Log raw content wyłączonego jest zwykle sednem: przechwycenie dopasowanego podłańcucha przepisałoby wyciekłe poświadczenie wprost do twojej własnej telemetrii. Trzymaj to wyłączone, chyba że masz wąską potrzebę triażu, i zrotuj każde poświadczenie, które zostało wychwycone — zablokowane żądanie oznacza, że sekret został ujawniony w prompcie, nie że jest bezpieczny. Zobacz Strumień dopasowań i Logowanie i prywatność.

8. Dokąd dalej

Detektory regex

Autorzuj własne wzorce poświadczeń regułami regex RE2.

Akcje

Wybierz block, mask, flag, annotate lub spotlight na regułę — i block, mask, flag lub annotate na encję.

PII Shield

Maskuj emaile, SSN i karty do typowanych tagów, zanim model je zobaczy.

Strojenie fałszywie pozytywnych

Oznaczaj fałszywie pozytywne i zacieśniaj detektory ze strumienia Matches.

Secrets Blocker trzyma poświadczenia z dala od treści, którą wysyłasz. Aby powstrzymać agenta przed wyciekiem sekretu przez wywołanie narzędzia — eksfiltracją do hosta kontrolowanego przez atakującego — użyj Firewalla i przeczytaj zagrożenie eksfiltracji danych i zagrożenie wycieku sekretów. Po kompletny silnik guardrail zobacz referencję Guardrails.

​1. Zapobiegaj przepływom wycieku klucza API LLM jednym presetem

​2. Zastosuj preset w konsoli

​3. Przetestuj, zanim powiążesz

​4. Rozszerz pokrycie

Private Keys & Cloud Tokens

Crypto Wallet Block

​5. Wychwyć też sekrety w odpowiedzi

​6. Jak wygląda blokada

​7. Zobacz, co zadziałało

​8. Dokąd dalej

Detektory regex

Akcje

PII Shield

Strojenie fałszywie pozytywnych

1. Zapobiegaj przepływom wycieku klucza API LLM jednym presetem

2. Zastosuj preset w konsoli

3. Przetestuj, zanim powiążesz

4. Rozszerz pokrycie

5. Wychwyć też sekrety w odpowiedzi

6. Jak wygląda blokada

7. Zobacz, co zadziałało

8. Dokąd dalej