Tạo một chính sách và gắn nó vào một key

Bạn có một key mà agent của bạn dùng trên api.orcarouter.ai, và bạn muốn mọi cuộc gọi tool mà key đó thực hiện đều được kiểm soát — block, audit, sanitize, hoặc giữ lại chờ phê duyệt — mà không động vào code agent. Đó là một thiết lập agent firewall hai bước: tạo một chính sách firewall một lần, rồi trỏ key vào nó. Từ cuộc gọi kế tiếp, mọi tool mà key phát ra đều được kiểm tra đối với chính sách tại gateway. Trang này là con đường tạo-và-gắn. Để biết mô hình chính sách đầy đủ (bề mặt, verdict, phân giải) xem Tổng quan Firewall; để biết ngữ pháp quy tắc xem Quy tắc Firewall.

Mọi cấu hình chính sách và key diễn ra trong console (hoặc các route quản lý /api/workspace/firewall/*, dùng session / access token của bạn — không phải một key relay sk-orca-…). Chỉ các cuộc gọi /v1/* của agent dùng key relay. Tạo và gắn một chính sách là một thao tác Developer+.

1. Thiết lập agent firewall trong nháy mắt

Một chính sách firewall là một đối tượng có tên, theo phạm vi workspace: một danh sách quy tắc có thứ tự cộng với một verdict mặc định cho mọi thứ không quy tắc nào khớp. Một key tham gia một chính sách qua trường firewall_policy_id của nó. Không có gì khác trong stack của bạn thay đổi.

Tạo chính sách

Đặt tên, chọn một verdict mặc định, thêm quy tắc — hoặc gieo từ một cấp độ tự chủ / preset rồi chỉnh sửa.

Gắn một key

Đặt firewall_policy_id của key về chính sách, hoặc đánh dấu chính sách làm mặc định của workspace để mọi key chưa gắn kế thừa nó.

2. Tạo một chính sách trong console

Mở Security → Firewall → Policies và chọn New policy.
Đặt tên (duy nhất trong workspace) và để Enabled bật.
Chọn một verdict mặc định — xem §3.
Thêm quy tắc trong trình chỉnh sửa quy tắc, hoặc bắt đầu trống và để Discovered tools dẫn dắt việc soạn từ traffic thực tế về sau.
Lưu. Chính sách tồn tại nhưng không kiểm soát gì cho đến khi một key trỏ vào nó hoặc bạn đặt nó làm mặc định của workspace.

Không muốn tự soạn quy tắc trước? Áp dụng một cấp độ tự chủ (balanced là điểm khởi đầu được khuyến nghị) — nó vật chất hóa các hàng chính sách và guardrail thực, có thể chỉnh sửa mà sau đó bạn tinh chỉnh. Hoặc bắt đầu một quy tắc từ một preset built-in rồi chỉnh sửa. Dù cách nào bạn cũng đến cùng một chỗ: một chính sách có tên mà bạn gắn vào một key.

3. Chọn verdict mặc định

Verdict mặc định là cái mà chính sách làm khi không quy tắc nào khớp một cuộc gọi tool. Nó là sàn của tư thế của bạn. Nó nhận đúng ba giá trị:

`default_verdict`	Khi không quy tắc nào khớp…
`audit` (mặc định)	Cho phép cuộc gọi, nhưng ghi lại. Quan sát mọi thứ, block không gì — chỗ an toàn để bắt đầu.
`allow`	Cho phép và ghi log, không có bản ghi xem xét.
`deny`	Block bất cứ thứ gì một quy tắc không cho phép tường minh — một tư thế default-deny mà bạn ghép với các quy tắc allow.

deny là default-deny: bất kỳ cuộc gọi tool nào mà các quy tắc của bạn không cho phép tường minh đều bị block. Mạnh mẽ, nhưng nó sẽ chặn các cuộc gọi mà bạn quên allow-list. Triển khai một chính sách default-deny dưới shadow mode trước và theo dõi feed sự kiện trước khi bạn thực thi nó.

Các verdict mà một quy tắc có thể tạo ra (allow, audit, deny, sanitize, pending_approval, cap_cost) được đề cập trong Verdict — verdict mặc định giới hạn ở ba cái trên.

4. Gắn chính sách vào một key

Một key tham gia một chính sách qua firewall_policy_id của nó. Trong console:

Mở Keys, chỉnh sửa key mà agent của bạn dùng.
Đặt Firewall policy về chính sách bạn đã tạo (việc này ghi firewall_policy_id).
Lưu. Cuộc gọi kế tiếp mà key đó thực hiện được kiểm soát.

Liên kết nằm trên key, trong gateway — agent của bạn vẫn gửi cùng Authorization: Bearer sk-orca-… và cùng thân request. Không có thay đổi nào với code gọi tool của agent bạn.

# Cuộc gọi relay của agent bạn không đổi. Chính sách đã gắn được thực thi
# tại gateway trước khi bất kỳ cuộc gọi tool nào trong response được dispatch.
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "delete the staging table"}],
    "tools": [{"type": "function", "function": {"name": "db.query"}}]
  }'

Nếu một quy tắc deny một cuộc gọi tool trên bề mặt inbound, cuộc gọi đó quay lại dưới dạng HTTP 400 với mã firewall_blocked, nêu tên tool và lý do — xem một block trông như thế nào.

5. Phân giải: đã gắn → mặc định workspace

Với bất kỳ cuộc gọi tool nào, gateway phân giải chính sách nào áp dụng theo thứ tự này:

1. Chính sách đã gắn của key

Nếu firewall_policy_id của key đang gọi trỏ vào một chính sách tồn tại và được bật, chính sách đó áp dụng.

2. Mặc định workspace

Ngược lại, chính sách is_default đã bật của workspace áp dụng (nếu có một cái được đặt). Mỗi workspace có nhiều nhất một chính sách làm mặc định; thăng cấp một mặc định mới sẽ hạ cấp cái cũ trong cùng một transaction.

3. Cả hai đều không → không thực thi

Không có liên kết và không có mặc định nghĩa là không có chính sách. Với observe mode bật, cuộc gọi được cho phép và ghi log như một khoảng trống độ phủ; với nó tắt, cuộc gọi được cho phép một cách im lặng.

Một chính sách đã gắn nhưng bị tắt sẽ fallback về mặc định của workspace — nó không tắt việc thực thi. (Điều này khác với guardrails, nơi một liên kết bị tắt phân giải về không có.) Để đưa một key ra khỏi phạm vi firewall, gỡ liên kết nó (đặt firewall_policy_id về 0), đừng chỉ tắt chính sách của nó.

Để đặt một chính sách làm mặc định cho mọi key chưa gắn, chỉnh sửa nó và đặt nó làm mặc định của workspace thay vì gắn từng key một — xem Quản lý chính sách.

6. Xác minh nó có hiệu lực

Trước khi tin cậy nó, xác nhận chính sách kích hoạt theo cách bạn mong đợi:

Test nó — tab sandbox Test dry-run chính sách đối với một cuộc gọi tool mẫu và trả về verdict, quy tắc đã khớp, và lý do. Không có gì được dispatch hay persist. Xem Test quy tắc.
Theo dõi feed sự kiện — một khi key nhận traffic thực, Events hiển thị mỗi lần đánh giá, có thể lọc theo verdict, surface, tool, và run.

Triển khai bất kỳ chính sách thực thi nào đằng sau shadow mode trước: nó đánh giá và ghi log chính xác như nó sẽ làm trong production, nhưng hạ cấp mọi verdict thực thi thành audit và thêm tiền tố lý do [shadow] would …. Tắt shadow một khi feed sự kiện cho thấy nó kích hoạt trên những gì bạn mong đợi và không trên những gì bạn không.

Đi đâu tiếp theo

Soạn quy tắc

Ngôn ngữ so khớp đầy đủ — tool glob, mệnh đề argument, danh sách egress, sanitizer.

Allow-list tool

Ghép một verdict mặc định deny với các quy tắc allow tường minh.

Quản lý chính sách

Mặc định, bật/tắt, versioning, và revert.

Tại sao zero trust

Tại sao kiểm soát hành động — không chỉ văn bản — quan trọng với agent.

Để biết các mối đe dọa mà một chính sách nhằm ngăn chặn, xem cuộc gọi tool nguy hiểm và excessive agency.

​1. Thiết lập agent firewall trong nháy mắt

Tạo chính sách

Gắn một key

​2. Tạo một chính sách trong console

​3. Chọn verdict mặc định

​4. Gắn chính sách vào một key

​5. Phân giải: đã gắn → mặc định workspace

​6. Xác minh nó có hiệu lực

​Đi đâu tiếp theo

Soạn quy tắc

Allow-list tool

Quản lý chính sách

Tại sao zero trust

1. Thiết lập agent firewall trong nháy mắt

2. Tạo một chính sách trong console

3. Chọn verdict mặc định

4. Gắn chính sách vào một key

5. Phân giải: đã gắn → mặc định workspace

6. Xác minh nó có hiệu lực

Đi đâu tiếp theo