1. Một guardrail bảo mật code thực sự làm gì
OrcaRouter phát hành một họ presetcode_security bạn áp dụng từ
trình chọn template. Mỗi cái là một quy tắc guardrail
thông thường — theo phạm vi workspace, có thứ tự, có thể gắn vào bất kỳ
key nào — được tinh chỉnh cho code:
.env / Secret-File Block
Block các gán secret kiểu
.env (DATABASE_URL=,
AWS_SECRET_ACCESS_KEY=, API_TOKEN=…) và các bãi đổ config nhiều
dòng được dán trước khi chúng đến provider. Dựa trên cú pháp gán,
không phải giá trị.License Compliance (copyleft)
Gắn cờ các request mang theo header copyleft mạnh — các tag SPDX GPL /
AGPL / LGPL / SSPL hoặc tên license đầy đủ — để một reviewer có thể xác
nhận code an toàn để trộn vào một codebase permissive. Chỉ-flag.
GPL/AGPL Provenance (output)
Flag giai đoạn output trên gợi ý mô hình mang theo chữ ký nguồn gốc
copyleft — một dấu mô hình có thể đã nhả lại dữ liệu huấn luyện
copyleft vào code được tạo.
Insecure-API Advisory
Annotate prompt với một cảnh báo bảo mật khi nó tham chiếu một sink
rủi ro cao —
eval( / exec( / os.system( / subprocess.run( /
pickle.loads( / child_process.exec(. Không chặn.Các preset
code_security là tất định — regex thuần, không có cuộc gọi
mạng, an toàn trên đường nóng. Các scanner nối mạng (tra cứu CVE, SBOM,
SAST) là kết nối ngoài riêng biệt, không phải preset. Xem
§3.2. Annotate — cảnh báo mô hình mà không thay đổi traffic
Các hành động bạn cấu hình trên một guardrail là block (từ chối cuộc gọi, HTTP 400), mask (redact match), và flag (chỉ ghi log). Bảo mật code thêm một hành vi thứ tư ngầm: annotate, cái không block cũng không che. Khi một quy tắc annotate match, gateway ghi lại một ghi chú ngắn và relay chèn nó lên thượng nguồn như một cảnh báo hệ thống — nên mô hình được bảo, ví dụ, “request này tham chiếu một API rủi ro cao (code eval, thực thi shell, hoặc deserialization không an toàn); hãy ưu tiên các lựa chọn an toàn hơn” — trước khi nó trả lời. Văn bản của người dùng không bao giờ bị từ chối và không bao giờ bị viết lại.Một ví dụ cụ thể
Áp dụng preset Insecure-API Advisory vào một guardrail và gắn nó vào một key. Rồi gửi code gọi một sink nguy hiểm:3. Trang trí CVE và SBOM qua scanner ngoài
Primitive cảnh báo tổng quát hóa. Kết nối một scanner bảo mật code như một vendor bên ngoài và các phát hiện của nó đi cùng đường annotate:Tra cứu CVE phụ thuộc (OSV)
Tra cứu CVE phụ thuộc (OSV)
Trích các import và pin manifest từ văn bản request và đối chiếu chúng
với cơ sở dữ liệu lỗ hổng OSV công khai. Một hit trang trí prompt với,
ví dụ, “requests@2.0.0 has CVE-2014-1830 (HIGH). Fixed in 2.20.0.” —
nên mô hình được bảo về một lỗ hổng đã biết trong một package nó được
yêu cầu dùng. Miễn phí và không xác thực, nên không có trường API-key.
Mặc định là annotate; bạn có thể đặt nó thành flag hoặc block thay
vào đó.
Scanner SBOM và SAST
Scanner SBOM và SAST
Kết nối một scanner SBOM (software bill-of-materials) hoặc SAST
(static-analysis) theo cùng cách bạn kết nối bất kỳ vendor bên ngoài
nào — một base URL cộng thông tin xác thực, lưu mã hóa và được che khi
đọc. Mỗi phát hiện mang một định danh ổn định, nên một phát hiện bạn đã
phân loại không kích hoạt lại trên mỗi request.
fail_open thành false trên quy tắc để fail closed cho
các chính sách mà một lần quét bị bỏ lỡ là không chấp nhận được.
4. Ghép với quy tắc secret và license
Một guardrail bảo mật code hiếm khi đi một mình. Hình dạng phổ biến là một guardrail với vài quy tắc:| Mục tiêu | Quy tắc |
|---|---|
| Chặn thông tin xác thực được dán | .env / Secret-File Block (block) |
| Bắt giá trị secret inline | Secrets Blocker (block) |
| Gate code copyleft | License Compliance (flag) |
| Lái các sink nguy hiểm | Insecure-API Advisory (annotate) |
5. Cấu hình nó (console + vai trò)
Mọi thứ ở đây được cấu hình trong console, không qua relay key. Các route quản lý (/api/guardrail/*) xác thực với session / access token của
bạn, không phải relay key sk-. Các thao tác đọc — liệt kê guardrails và
feed Matches — mở cho mọi thành viên workspace. Các thao tác ghi (tạo
/ chỉnh sửa / xóa) và sandbox test yêu cầu vai trò Developer hoặc
cao hơn: sandbox có thể kích hoạt các cuộc gọi mô hình trả phí và các
request vendor đi ra ngoài, nên nó được gate như một thao tác ghi.
Tạo guardrail
Trong console, mở Guardrails → New guardrail. Split-button thả bạn
vào thư viện template — chọn một preset Code security làm điểm khởi
đầu.
Chỉnh sửa tự do
Một preset là một hạt giống, không phải một khóa. Tinh chỉnh regex,
thêm một quy tắc Secrets Blocker, đổi một hành động. Dùng tab Test
để chứng minh một quy tắc kích hoạt theo cách bạn kỳ vọng đối với văn
bản mẫu trước khi bạn gắn nó vào một key.
Các phát hiện đáp xuống feed Matches của workspace (loại quy tắc, hành
động, giai đoạn, chi tiết). Chuỗi con đã match được ghi lại chỉ khi
Log raw content được bật — mặc định tắt, lập trường bảo thủ về quyền
riêng tư. Xem
logging & quyền riêng tư.
6. Đi đâu tiếp theo
- Block secret — quy tắc đồng hành bắt giá trị thông tin xác thực trong đối số request.
- Hành động — block, mask, flag, annotate, và spotlight chuyên sâu.
- Compliance logger — giữ một bản ghi bất biến của mọi phát hiện bảo mật code.
- Testing & eval — chứng minh chính sách của bạn bắt code known-bad trước khi bạn phát hành nó.
- Tài liệu tham khảo Guardrails — engine đầy đủ.
- Bảo mật AI agent — nơi rail bảo-mật-code phù hợp trong control stack zero-trust.
