Przejdź do głównej treści
To najszybsza ścieżka od niezabezpieczonego agenta do postawy zero trust. Stosujesz jeden przełącznik, dalej wywołujesz bramę dokładnie jak wcześniej, obserwujesz, co twój agent faktycznie robi, a potem zaostrzasz. Bez tworzenia reguł, bez zmian SDK.
Zastosowanie postawy bezpieczeństwa zmienia ustawienie przestrzeni roboczej, więc kroki 2 i 5 wymagają roli Developer. Strumień Matches guardrail (krok 4) jest otwarty dla każdego członka; strumień Events firewalla też wymaga Developer.

Włącz to w 5 krokach

1

Uzyskaj klucz API

Jeśli jeszcze nie masz, utwórz klucz — patrz Uzyskaj klucz API. Daj ten klucz agentowi, który chcesz zabezpieczyć. Wszystko poniżej wiąże się z twoją przestrzenią roboczą, więc ta sama postawa obejmuje każdy klucz w niej.
2

Zastosuj bazę Secure Agents

W konsoli otwórz Firewall → Posture i zastosuj poziom autonomii balanced (rola Developer).W jednej transakcji ustawia to postawę zarówno Firewall, jak i Guardrails: wywołania narzędzi są audytowane i PII jest flagowane, podczas gdy najbardziej destrukcyjne akcje (jak destrukcyjny shell) są odmawiane — więc obserwujesz przed szerokim egzekwowaniem. To pojedynczy przełącznik z jednym kliknięciem cofnięcia. (Dla przejścia, które nic nie blokuje, zacznij od permissive.)
3

Wyślij żądanie dokładnie jak wcześniej

Nic w twoim wywołaniu się nie zmienia. Użyj tego samego klucza, tego samego formatu OpenAI:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Summarize my notes and email me at jane@acme.com"}
    ]
  }'
Żądanie przechodzi. Pod balanced nie jest blokowane — jest obserwowane. Email jest flagowany, a wywołania narzędzi, które twój agent wykonuje, są rejestrowane.
4

Zobacz, co twój agent faktycznie zrobił

Dwa strumienie, oba w zakresie przestrzeni roboczej:
  • Firewall → Events / Runs — każde wywołanie narzędzia, które twój agent wykonał, jego werdykt i która powierzchnia go trafiła (narzędzie, które ogłosił, wywołanie emitowane przez model, dyspozycja MCP lub zewnętrzne miejsce docelowe).
  • Guardrails → Matches — każda reguła, która odpaliła, jak oflagowany email, pogrupowane według guardrail i akcji.
To jest wartość obserwowania najpierw: widzisz rzeczywiste zachowanie swojego agenta, zanim jakakolwiek reguła może je przerwać.
5

Zaostrzaj, aby egzekwować

Gdy strumienie wyglądają dobrze, przełącz poziom autonomii na tight na tej samej stronie Firewall → Posture (rola Developer).Teraz egzekwowanie jest aktywne: PII jest maskowane przed zobaczeniem przez model, sekrety są blokowane z twoich żądań, a destrukcyjne wywołania shella i egress SSRF są odmawiane. Odmówione wywołanie narzędzia wraca jako HTTP 400 firewall_blocked; zablokowany prompt wraca jako HTTP 400 guardrail_blocked — a blokada nie kosztuje cię żadnego limitu. Bez zmiany aplikacji — następne żądanie jest zarządzane.
To jest zero trust włączone: każdy prompt i odpowiedź sprawdzone, każde wywołanie narzędzia i rutowane wychodzące żądanie zarządzane, każda decyzja zalogowana.

Co właśnie włączyłeś

WarstwaPod balancedPod tight
Guardrails (tekst)PII flagowane (tylko audyt)PII maskowane, sekrety blokowane
Firewall (akcje)Audytowane; destrukcyjny shell odmówionyDomyślna odmowa; destrukcyjny shell + egress SSRF odmówione
WidocznośćPełna — Events + MatchesPełna — Events + Matches

Zbyt restrykcyjne?

Każda zmiana autonomii to jedna transakcja z jednym kliknięciem cofnięcia, więc możesz cofnąć się do poprzedniej postawy ze strony Firewall (lub API cofnięcia). Możesz też po prostu ponownie zastosować łagodniejszy poziom (balanced lub permissive) w dowolnym czasie.

Następne kroki

Baza Secure Agents

Co ustawia każdy poziom autonomii i jak symulować przed zastosowaniem.

Tryby egzekwowania

Obserwacja → cień → egzekwowanie, bezpieczne wdrożenie w szczegółach.

Guardrails

Twórz własne reguły treści poza bazą.

Agent Firewall

Twórz listy dozwolonych narzędzi, sprawdzenia argumentów i reguły egress.