Áp dụng tư thế bảo mật thay đổi cài đặt workspace, nên bước 2 và 5
cần vai trò Developer. Feed Matches guardrail (bước 4) mở cho
mọi thành viên; feed Events firewall cũng cần Developer.
Bật trong 5 bước
Lấy API key
Nếu bạn chưa có, tạo một key — xem
Lấy API key. Cho key này cho
agent bạn muốn bảo mật. Mọi thứ bên dưới ràng buộc với workspace
của bạn, nên cùng một tư thế bao phủ mọi key trong đó.
Áp dụng Secure Agents baseline
Trong console, mở Firewall → Posture và áp dụng
balanced autonomy level
(vai trò Developer).Trong một transaction này đặt cả tư thế Firewall và Guardrails:
lời gọi tool được audit và PII được flag, trong khi các hành động
phá hủy nhất (như destructive shell) bị từ chối — nên bạn quan sát
trước khi thực thi rộng rãi. Đây là một công tắc duy nhất với hoàn
tác một cú nhấp. (Để có lượt không block gì cả, bắt đầu ở
permissive.)Gửi request như trước
Không có gì về cuộc gọi của bạn thay đổi. Dùng cùng key, cùng
OpenAI shape:Request đi qua. Dưới
balanced nó không bị block — nó được quan
sát. Email được flag, và mọi lời gọi tool mà agent của bạn thực
hiện đều được ghi lại.Xem những gì agent của bạn thực sự đã làm
Hai feed, cả hai theo phạm vi workspace:
- Firewall → Events / Runs — mọi lời gọi tool mà agent của bạn thực hiện, verdict của nó, và bề mặt nào nó hit (tool nó đã quảng bá, cuộc gọi mô hình đã phát ra, một MCP dispatch, hoặc một đích đến đi ra ngoài).
- Guardrails → Matches — mọi quy tắc đã kích hoạt, như email được flag, được nhóm theo guardrail và hành động.
Siết chặt để thực thi
Một khi các feed trông đúng, chuyển autonomy level sang
tight
trên cùng trang Firewall → Posture (vai trò Developer).Giờ thực thi đang hoạt động: PII bị mask trước khi mô hình thấy nó,
secret bị block khỏi request, và lời gọi destructive shell cùng SSRF
egress bị từ chối. Một lời gọi tool bị từ chối trở về là HTTP 400
firewall_blocked; một prompt bị block trở về là HTTP 400
guardrail_blocked — và một block không tốn quota của bạn. Không
thay đổi ứng dụng — request kế tiếp ngay lập tức được quản lý.Những gì bạn vừa bật
| Lớp | Dưới balanced | Dưới tight |
|---|---|---|
| Guardrails (văn bản) | PII được flag (audit-only) | PII bị mask, secret bị block |
| Firewall (hành động) | Được audit; destructive shell bị từ chối | Default-deny; destructive shell + SSRF egress bị từ chối |
| Khả năng quan sát | Đầy đủ — Events + Matches | Đầy đủ — Events + Matches |
Đã đặt quá chặt?
Mọi thay đổi autonomy đều là một transaction với hoàn tác một cú nhấp, nên bạn có thể roll back thẳng về tư thế trước đó từ trang Firewall (hoặc undo API). Bạn cũng có thể chỉ re-apply một level mềm hơn (balanced hoặc permissive) bất kỳ lúc nào.
Tiếp theo
Secure Agents baseline
Những gì mỗi autonomy level đặt, và cách simulate trước khi áp dụng.
Enforcement modes
Observe → shadow → enforce, triển khai an toàn chi tiết.
Guardrails
Soạn quy tắc nội dung tùy chỉnh vượt ra ngoài baseline.
Agent Firewall
Soạn tool allow-list, kiểm tra đối số, và quy tắc egress.
