Thư viện template và preset

Bạn muốn một chính sách nội dung tại chỗ nhanh, mà không viết regex hoặc danh sách entity PII bằng tay. Thư viện template là lối tắt: một bộ các preset guardrail sẵn-có, được nhóm theo trường hợp dùng, mỗi cái gieo một chính sách hoạt động trong một cú nhấp. Chọn một, đặt tên nó, và bạn có một bộ quy tắc có thứ tự hoàn chỉnh bạn có thể gắn vào một key — hoặc chỉnh sửa trước. Đây là trang đích tập trung cho trường hợp dùng preset. Về engine guardrail đầy đủ — mọi loại quy tắc, trường, hành động, và route — xem tài liệu tham khảo Guardrails.

1. Thư viện template guardrail AI cho bạn cái gì

Một preset là một điểm khởi đầu có tên thả một Policy hoàn chỉnh (một hoặc nhiều quy tắc có thứ tự) vào modal tạo. Các preset được soạn ở phía server, nên trình chọn console, sandbox Test, và các tài liệu này đều mô tả chính xác cùng hành vi — có một nguồn sự thật duy nhất. Mỗi preset là một hạt giống, không phải một khóa. Một khi bạn áp dụng một cái, bạn sở hữu bản sao: đổi tên nó, thêm hoặc xóa quy tắc, đổi hành động hoặc giai đoạn của một quy tắc, tinh chỉnh lại một detector. Không có gì về template gốc ràng buộc các chỉnh sửa của bạn.

Áp dụng một preset, như mọi soạn thảo guardrail, là một hành động console dưới phiên workspace của riêng bạn, và tạo hoặc chỉnh sửa một guardrail yêu cầu Developer+ trong workspace. Chỉ cuộc gọi relay /v1/* cuối cùng dùng một key sk-orca-....

2. Danh mục preset

Trình chọn nhóm các preset thành tám danh mục. Mỗi cái ánh xạ tới một kiểm soát phổ biến mà nếu không bạn sẽ xây bằng tay:

PII — redact hoặc block dữ liệu cá nhân

Phát hiện và che (hoặc block) email, điện thoại, SSN, thẻ, IP và nhiều hơn. Bắt đầu với PII Shield cho masking một-quy-tắc, hoặc một blocker nghiêm khi PII không bao giờ được đến provider.

Secret — giữ thông tin xác thực khỏi prompt

Block các key AWS / OpenAI / GitHub, PEM private key, cloud token và địa chỉ ví crypto trước khi chúng rời gateway. Xem Block secret.

Compliance — rail dữ liệu được quản chế

Block thẻ PCI, block định danh EU/UK, block định danh y tế, và một compliance logger chỉ-quan-sát ghi lại các lần xuất hiện PII mà không thay đổi traffic.

Brand — denylist và an toàn thương hiệu

Denylist keyword cho lời tục, nhắc đến đối thủ, và thuật ngữ bị cấm đặc thù khu vực — block hoặc mask. Xem An toàn thương hiệu và Từ nhạy cảm.

Safety — injection, jailbreak, tự hại

Rail keyword/regex cho các cụm prompt-injection, pattern jailbreak / role-play, phát hiện rò rỉ system-prompt, và denylist tự-hại. Xem Prompt injection.

Cost — giới hạn kích thước và độ dài

Giới hạn max_chars trên prompt request và phản hồi mô hình để giới hạn chi phí và độ trễ. Xem Cost guardrails.

Agent — bộ lọc nội dung agentic

Bộ lọc URL, block ảnh markdown (phòng thủ exfil-ảnh), pattern shell-injection, và bộ lọc SQL-injection-trong-output cho các luồng agent. Xem Guardrail agentic.

Code security — secret, license, API rủi ro

Block gán file-secret / .env, flag license copyleft mạnh (GPL / AGPL / LGPL / SSPL) trên request và output mô hình, và một cảnh báo không chặn annotate các prompt tham chiếu các sink rủi ro cao (eval, os.system, pickle.loads). Xem Bảo mật code.

Preset chỉ gieo các loại quy tắc tất định — keyword, regex, PII, và max-chars. Các loại quy tắc nâng cao (vendor bên ngoài, LLM judge, contextual grounding) được thêm từ trình tạo quy tắc, không phải từ một template, vì chúng cần một kết nối hoặc một mô hình bạn chọn.

3. Áp dụng một preset như một hạt giống

Mọi bước ở đây là một hành động console. Relay key chỉ xuất hiện trong request cuối cùng.

Mở trình chọn template

Trong console, mở Guardrails và nhấn split-button New guardrail. Trình chọn mở được nhóm theo tám danh mục ở trên.

Chọn một preset

Chọn một — ví dụ PII Shield từ danh mục PII. Nó gieo một chính sách hoàn chỉnh (ở đây, một quy tắc masking pii duy nhất). Trình chọn hiển thị mô tả của mỗi preset nên bạn biết nó làm gì trước khi bạn áp dụng nó.

Đặt tên nó và chỉnh sửa tự do

Đặt cho nó một tên (≤ 64 ký tự). Các quy tắc đã gieo giờ là của bạn — thêm, xóa, hoặc tinh chỉnh lại bất kỳ cái nào. Một preset là một hạt giống, không phải một khóa.

Test trước khi bạn gắn

Mở tab Test, dán một mẫu, chọn một giai đoạn, và chạy chính sách cục bộ — không có cuộc gọi thượng nguồn, không quota. Chứng minh nó làm điều bạn kỳ vọng trước khi bất kỳ key nào trỏ vào nó.

Gắn một key

Chỉnh sửa một API key và chọn guardrail từ dropdown Guardrail (đặt guardrail_id trên key), hoặc đánh dấu nó là mặc định workspace. Xem Gắn vào một key và Mặc định tài khoản.

4. Một ví dụ cụ thể: gieo, rồi thực thi

Áp dụng preset PII Shield. Nó gieo chính xác một quy tắc:

{
  "type": "pii",
  "stage": "both",
  "action": "mask",
  "entities": ["email", "phone", "ssn", "credit_card", "ip"]
}

Đó là một chính sách masking dùng được ngay khi mở hộp. Nhưng vì preset là một hạt giống, bạn có thể siết chặt nó ngay lập tức — ví dụ, đổi hai entity thành block với một ghi đè theo từng entity để thẻ và SSN bị từ chối thẳng trong khi phần còn lại được che:

{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}

Lưu, gắn vào một key, và gọi gateway y như trước — không đổi SDK, không triển khai lại:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

Gateway che email thành [EMAIL] trước khi chuyển tiếp. Một request mang theo một số thẻ bị từ chối với HTTP 400 guardrail_blocked — cái không tốn quota (một block input kích hoạt trước khi đo lường) và được đánh dấu skip-retry. Xem lỗi guardrail_blocked.

Preset PII Shield gieo một quy tắc masking giai đoạn both, nhưng masking trực tiếp output mô hình và phản hồi streamed nằm trong lộ trình — masking giai đoạn input là đường trực tiếp (gateway chà sạch request trước khi mô hình thấy nó). Để gate phản hồi mô hình hôm nay, một quy tắc block output được thực thi cả streaming lẫn non-streaming. Xem quy tắc giai đoạn output và phạm vi streaming.

5. Sau khi bạn áp dụng — phần còn lại là engine

Một preset chỉ là một cách nhanh để soạn quy tắc. Mọi thứ downstream là engine guardrail bình thường:

Bạn nhận	Ở đâu
Hành động theo từng quy tắc	Hành động
Test + eval	Testing & eval
Cái gì đã kích hoạt	Matches feed
Quay lui một thay đổi	Versioning

Mỗi lần tạo, cập nhật, và xóa trên một guardrail — bao gồm khoảnh khắc bạn áp dụng một preset và lưu — viết một hàng lịch sử có phiên bản. Bạn có thể diff bất kỳ hai phiên bản nào và revert về một cái sớm hơn, nên chỉnh sửa một chính sách đã gieo không bao giờ là một cánh cửa một chiều. Xem Versioning.

6. Đi đâu tiếp theo

PII Shield

Preset che-PII một-cú-nhấp, từ đầu đến cuối.

Block secret

Preset Secrets Blocker — bắt key và thông tin xác thực trong request.

Guardrail agentic

Bộ lọc URL, ảnh markdown, shell, và SQL cho các luồng agent.

Tài liệu tham khảo Guardrails

Engine hoàn chỉnh — mọi loại quy tắc, trường, và route.

Preset gieo các chính sách nội dung. Để quản trị lời gọi tool của một agent — từ chối các hành động hủy hoại, redact đối số lời gọi tool, yêu cầu phê duyệt — bắt đầu với Firewall và Bảo mật AI agent. Về cách hai lớp chia công việc, xem Guardrails so với Firewall.

​1. Thư viện template guardrail AI cho bạn cái gì

​2. Danh mục preset

​3. Áp dụng một preset như một hạt giống

​4. Một ví dụ cụ thể: gieo, rồi thực thi

​5. Sau khi bạn áp dụng — phần còn lại là engine

​6. Đi đâu tiếp theo

PII Shield

Block secret

Guardrail agentic

Tài liệu tham khảo Guardrails

1. Thư viện template guardrail AI cho bạn cái gì

2. Danh mục preset

3. Áp dụng một preset như một hạt giống

4. Một ví dụ cụ thể: gieo, rồi thực thi

5. Sau khi bạn áp dụng — phần còn lại là engine

6. Đi đâu tiếp theo