Chuyển đến nội dung chính
Đây là con đường nhanh nhất từ một agent không được bảo vệ đến tư thế zero-trust. Bạn áp dụng một công tắc, tiếp tục gọi gateway như trước, xem những gì agent của bạn thực sự làm, rồi siết chặt. Không cần soạn quy tắc, không thay đổi SDK.
Áp dụng tư thế bảo mật thay đổi cài đặt workspace, nên bước 2 và 5 cần vai trò Developer. Feed Matches guardrail (bước 4) mở cho mọi thành viên; feed Events firewall cũng cần Developer.

Bật trong 5 bước

1

Lấy API key

Nếu bạn chưa có, tạo một key — xem Lấy API key. Cho key này cho agent bạn muốn bảo mật. Mọi thứ bên dưới ràng buộc với workspace của bạn, nên cùng một tư thế bao phủ mọi key trong đó.
2

Áp dụng Secure Agents baseline

Trong console, mở Firewall → Posture và áp dụng balanced autonomy level (vai trò Developer).Trong một transaction này đặt cả tư thế Firewall và Guardrails: lời gọi tool được audit và PII được flag, trong khi các hành động phá hủy nhất (như destructive shell) bị từ chối — nên bạn quan sát trước khi thực thi rộng rãi. Đây là một công tắc duy nhất với hoàn tác một cú nhấp. (Để có lượt không block gì cả, bắt đầu ở permissive.)
3

Gửi request như trước

Không có gì về cuộc gọi của bạn thay đổi. Dùng cùng key, cùng OpenAI shape:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Summarize my notes and email me at jane@acme.com"}
    ]
  }'
Request đi qua. Dưới balanced nó không bị block — nó được quan sát. Email được flag, và mọi lời gọi tool mà agent của bạn thực hiện đều được ghi lại.
4

Xem những gì agent của bạn thực sự đã làm

Hai feed, cả hai theo phạm vi workspace:
  • Firewall → Events / Runs — mọi lời gọi tool mà agent của bạn thực hiện, verdict của nó, và bề mặt nào nó hit (tool nó đã quảng bá, cuộc gọi mô hình đã phát ra, một MCP dispatch, hoặc một đích đến đi ra ngoài).
  • Guardrails → Matches — mọi quy tắc đã kích hoạt, như email được flag, được nhóm theo guardrail và hành động.
Đây là phần thưởng của việc quan sát trước: bạn thấy hành vi thực tế của agent trước khi bất kỳ quy tắc nào có thể phá vỡ nó.
5

Siết chặt để thực thi

Một khi các feed trông đúng, chuyển autonomy level sang tight trên cùng trang Firewall → Posture (vai trò Developer).Giờ thực thi đang hoạt động: PII bị mask trước khi mô hình thấy nó, secret bị block khỏi request, và lời gọi destructive shell cùng SSRF egress bị từ chối. Một lời gọi tool bị từ chối trở về là HTTP 400 firewall_blocked; một prompt bị block trở về là HTTP 400 guardrail_blocked — và một block không tốn quota của bạn. Không thay đổi ứng dụng — request kế tiếp ngay lập tức được quản lý.
Đó là zero trust đã bật: mọi prompt và phản hồi được sàng lọc, mọi lời gọi tool và request đi ra ngoài được định tuyến đều được quản lý, mọi quyết định đều được ghi log.

Những gì bạn vừa bật

LớpDưới balancedDưới tight
Guardrails (văn bản)PII được flag (audit-only)PII bị mask, secret bị block
Firewall (hành động)Được audit; destructive shell bị từ chốiDefault-deny; destructive shell + SSRF egress bị từ chối
Khả năng quan sátĐầy đủ — Events + MatchesĐầy đủ — Events + Matches

Đã đặt quá chặt?

Mọi thay đổi autonomy đều là một transaction với hoàn tác một cú nhấp, nên bạn có thể roll back thẳng về tư thế trước đó từ trang Firewall (hoặc undo API). Bạn cũng có thể chỉ re-apply một level mềm hơn (balanced hoặc permissive) bất kỳ lúc nào.

Tiếp theo

Secure Agents baseline

Những gì mỗi autonomy level đặt, và cách simulate trước khi áp dụng.

Enforcement modes

Observe → shadow → enforce, triển khai an toàn chi tiết.

Guardrails

Soạn quy tắc nội dung tùy chỉnh vượt ra ngoài baseline.

Agent Firewall

Soạn tool allow-list, kiểm tra đối số, và quy tắc egress.