Thư viện template guardrail AI OrcaRouter: chọn một preset từ danh mục PII, secret, compliance, brand, safety, cost, hoặc agent, áp dụng nó như một hạt giống, rồi chỉnh sửa mọi quy tắc tự do trước khi bạn gắn một key.
Bạn muốn một chính sách nội dung tại chỗ nhanh, mà không viết regex hoặc
danh sách entity PII bằng tay. Thư viện template là lối tắt: một bộ
các preset guardrail sẵn-có, được nhóm theo trường hợp dùng, mỗi cái gieo
một chính sách hoạt động trong một cú nhấp. Chọn một, đặt tên nó, và bạn
có một bộ quy tắc có thứ tự hoàn chỉnh bạn có thể gắn vào một key — hoặc
chỉnh sửa trước.Đây là trang đích tập trung cho trường hợp dùng preset. Về engine
guardrail đầy đủ — mọi loại quy tắc, trường, hành động, và route — xem
tài liệu tham khảo Guardrails.
Một preset là một điểm khởi đầu có tên thả một Policy hoàn chỉnh
(một hoặc nhiều quy tắc có thứ tự) vào modal tạo. Các preset được soạn ở
phía server, nên trình chọn console,
sandbox Test, và các tài liệu này
đều mô tả chính xác cùng hành vi — có một nguồn sự thật duy nhất.Mỗi preset là một hạt giống, không phải một khóa. Một khi bạn áp dụng
một cái, bạn sở hữu bản sao: đổi tên nó, thêm hoặc xóa quy tắc, đổi
hành động hoặc
giai đoạn của một quy tắc, tinh
chỉnh lại một detector. Không có gì về template gốc ràng buộc các chỉnh
sửa của bạn.
Áp dụng một preset, như mọi soạn thảo guardrail, là một hành động
console dưới phiên workspace của riêng bạn, và tạo hoặc chỉnh sửa một
guardrail yêu cầu Developer+ trong workspace. Chỉ cuộc gọi relay
/v1/* cuối cùng dùng một key sk-orca-....
Trình chọn nhóm các preset thành tám danh mục. Mỗi cái ánh xạ tới một kiểm
soát phổ biến mà nếu không bạn sẽ xây bằng tay:
PII — redact hoặc block dữ liệu cá nhân
Phát hiện và che (hoặc block) email, điện thoại, SSN, thẻ, IP và nhiều
hơn. Bắt đầu với PII Shield cho
masking một-quy-tắc, hoặc một blocker nghiêm khi PII không bao giờ
được đến provider.
Secret — giữ thông tin xác thực khỏi prompt
Block các key AWS / OpenAI / GitHub, PEM private key, cloud token và
địa chỉ ví crypto trước khi chúng rời gateway. Xem
Block secret.
Compliance — rail dữ liệu được quản chế
Block thẻ PCI, block định danh EU/UK, block định danh y tế, và một
compliance logger
chỉ-quan-sát ghi lại các lần xuất hiện PII mà không thay đổi traffic.
Brand — denylist và an toàn thương hiệu
Denylist keyword cho lời tục, nhắc đến đối thủ, và thuật ngữ bị cấm đặc
thù khu vực — block hoặc mask. Xem
An toàn thương hiệu và
Từ nhạy cảm.
Safety — injection, jailbreak, tự hại
Rail keyword/regex cho các cụm prompt-injection, pattern jailbreak /
role-play, phát hiện rò rỉ system-prompt, và denylist tự-hại. Xem
Prompt injection.
Cost — giới hạn kích thước và độ dài
Giới hạn max_chars trên prompt request và phản hồi mô hình để giới
hạn chi phí và độ trễ. Xem
Cost guardrails.
Agent — bộ lọc nội dung agentic
Bộ lọc URL, block ảnh markdown (phòng thủ exfil-ảnh), pattern
shell-injection, và bộ lọc SQL-injection-trong-output cho các luồng
agent. Xem Guardrail agentic.
Code security — secret, license, API rủi ro
Block gán file-secret / .env, flag license copyleft mạnh (GPL / AGPL
/ LGPL / SSPL) trên request và output mô hình, và một cảnh báo không
chặn annotate các prompt tham chiếu các sink rủi ro cao (eval,
os.system, pickle.loads). Xem
Bảo mật code.
Preset chỉ gieo các loại quy tắc tất định — keyword, regex, PII, và
max-chars. Các loại quy tắc nâng cao (vendor bên ngoài,
LLM judge, contextual grounding)
được thêm từ trình tạo quy tắc, không phải từ một template, vì chúng cần
một kết nối hoặc một mô hình bạn chọn.
Mọi bước ở đây là một hành động console. Relay key chỉ xuất hiện trong
request cuối cùng.
1
Mở trình chọn template
Trong console, mở Guardrails và nhấn split-button New
guardrail. Trình chọn mở được nhóm theo tám danh mục ở trên.
2
Chọn một preset
Chọn một — ví dụ PII Shield từ danh mục PII. Nó gieo một chính
sách hoàn chỉnh (ở đây, một quy tắc masking pii duy nhất). Trình chọn
hiển thị mô tả của mỗi preset nên bạn biết nó làm gì trước khi bạn áp
dụng nó.
3
Đặt tên nó và chỉnh sửa tự do
Đặt cho nó một tên (≤ 64 ký tự). Các quy tắc đã gieo giờ là của bạn —
thêm, xóa, hoặc tinh chỉnh lại bất kỳ cái nào. Một preset là một hạt
giống, không phải một khóa.
4
Test trước khi bạn gắn
Mở tab Test, dán một mẫu, chọn một giai đoạn, và chạy chính sách
cục bộ — không có cuộc gọi thượng nguồn, không quota. Chứng minh nó làm
điều bạn kỳ vọng trước khi bất kỳ key nào trỏ vào nó.
5
Gắn một key
Chỉnh sửa một API key và chọn guardrail từ dropdown Guardrail (đặt
guardrail_id trên key), hoặc đánh dấu nó là mặc định workspace.
Xem Gắn vào một key và
Mặc định tài khoản.
Đó là một chính sách masking dùng được ngay khi mở hộp. Nhưng vì preset là
một hạt giống, bạn có thể siết chặt nó ngay lập tức — ví dụ, đổi hai
entity thành block với một ghi đè theo từng entity để thẻ và SSN bị từ
chối thẳng trong khi phần còn lại được che:
Gateway che email thành [EMAIL] trước khi chuyển tiếp. Một request mang
theo một số thẻ bị từ chối với HTTP 400guardrail_blocked — cái
không tốn quota (một block input kích hoạt trước khi đo lường) và được
đánh dấu skip-retry. Xem
lỗi guardrail_blocked.
Preset PII Shield gieo một quy tắc masking giai đoạn both, nhưng
masking trực tiếp output mô hình và phản hồi streamed nằm trong lộ
trình — masking giai đoạn input là đường trực tiếp (gateway chà sạch
request trước khi mô hình thấy nó). Để gate phản hồi mô hình hôm nay,
một quy tắc block output được thực thi cả streaming lẫn non-streaming.
Xem quy tắc giai đoạn output và
phạm vi streaming.
Mỗi lần tạo, cập nhật, và xóa trên một guardrail — bao gồm khoảnh khắc bạn
áp dụng một preset và lưu — viết một hàng lịch sử có phiên bản. Bạn có thể
diff bất kỳ hai phiên bản nào và revert về một cái sớm hơn, nên
chỉnh sửa một chính sách đã gieo không bao giờ là một cánh cửa một chiều.
Xem Versioning.
Preset Secrets Blocker — bắt key và thông tin xác thực trong request.
Guardrail agentic
Bộ lọc URL, ảnh markdown, shell, và SQL cho các luồng agent.
Tài liệu tham khảo Guardrails
Engine hoàn chỉnh — mọi loại quy tắc, trường, và route.
Preset gieo các chính sách nội dung. Để quản trị lời gọi tool của
một agent — từ chối các hành động hủy hoại, redact đối số lời gọi tool,
yêu cầu phê duyệt — bắt đầu với Firewall và
Bảo mật AI agent. Về cách hai
lớp chia công việc, xem
Guardrails so với Firewall.