AKIA..., một .env được dán, một agent dội
lại token sk-... của chính nó — bất kỳ cái nào trong số đó có thể gửi
một thông tin xác thực còn sống tới OpenAI, Anthropic, hay Google ở dạng
rõ, nơi nó đáp xuống log của họ và của bạn. Secrets Blocker chặn điều
đó tại gateway: một preset guardrail một-cú-nhấp quét request tìm các
hình dạng thông tin xác thực và từ chối cuộc gọi với HTTP 400 trước
khi một byte rời gateway của bạn.
Đây là trang đích tập trung cho trường hợp dùng rò rỉ secret. Về engine
guardrail đầy đủ — mọi loại quy tắc, trường, và route — xem
tài liệu tham khảo Guardrails.
1. Ngăn các luồng rò rỉ API key LLM trong một preset
Cả mục đích của hệ thốngngăn rò rỉ API key LLM là bắt thông tin xác
thực trước cuộc gọi thượng nguồn, không phải sau khi nó đã ở trong log
request của một provider. Preset Secrets Blocker làm chính xác điều
đó. Nó là một guardrail nhỏ gồm các quy tắc block giai đoạn input,
mỗi cái là một regex cho một hình dạng thông tin xác thực nổi tiếng:
AWS access key
AWS access key
AKIA theo sau bởi 16 ký tự chữ-số viết hoa — hình dạng access-key-id
AWS kinh điển.Secret key kiểu OpenAI
Secret key kiểu OpenAI
Một tiền tố
sk- theo sau bởi một thân token dài — hình dạng được
dùng bởi OpenAI và một số provider key trông giống.GitHub personal access token
GitHub personal access token
Một tiền tố
ghp_ theo sau bởi một thân 36 ký tự./v1/chat/completions y như trước, không đổi
SDK và không triển khai lại.
Giai đoạn input, trước khi đo lường. Secrets Blocker sàng lọc những
gì bạn gửi. Một match từ chối cuộc gọi trước khi mô hình được gọi,
nên thông tin xác thực không bao giờ đến provider và một request bị block
không tốn quota. Để cũng bắt một secret mà một mô hình phát lại cho
client, ghép nó với một preset block output — xem
§5.
2. Áp dụng preset trong console
Mọi bước ở đây là một hành động console trên gateway được lưu trữ dưới phiên của riêng bạn. Tạo và chỉnh sửa guardrails yêu cầu Developer+ trong workspace. Chỉ cuộc gọi/v1/* cuối cùng dùng một
relay key sk-orca-....
Mở template
Trong console, mở Guardrails, nhấn split-button New guardrail,
và chọn Secrets & API-Key Blocker từ danh mục template
Secrets. Nó gieo các quy tắc block giai đoạn input.
Đặt tên và lưu
Đặt cho nó một tên (≤ 64 ký tự), ví dụ
secrets-blocker, và lưu. Một
preset là một hạt giống, không phải một khóa — thêm hoặc chỉnh sửa quy
tắc tự do sau đó (xem §4).Test nó
Mở tab Test, dán một thông tin xác thực mẫu ở giai đoạn
input,
và chạy chính sách cục bộ — không có cuộc gọi thượng nguồn, không
quota (xem §3).Gắn một key
Chỉnh sửa một API key và chọn
secrets-blocker từ dropdown
Guardrail (đặt guardrail_id trên key), hoặc đánh dấu nó là mặc
định workspace. Xem
Gắn vào một key và
Mặc định tài khoản.3. Test trước khi bạn gắn
Chứng minh quy tắc kích hoạt trước khi bất kỳ key nào trỏ vào nó. Mở tab Test bên trong editor, dán một thông tin xác thực giả, chọn giai đoạninput, và chạy:
4. Mở rộng phạm vi
Secrets Blocker bao quát ba hình dạng có traffic cao nhất. Danh mục Secrets có các preset anh em bạn có thể áp dụng song song với nó, và bạn có thể soạn quy tắcregex của riêng mình cho bất kỳ token nào stack
của bạn phát hành:
Private Keys & Cloud Tokens
Một preset Secrets đồng hành block các private key PEM, token
Slack và Stripe, Google API key, và JWT trên request.
Crypto Wallet Block
Block các địa chỉ ví kiểu BTC và ETH trên request khi chúng không bao
giờ nên đến provider.
regex — pattern RE2, thời
gian tuyến tính, không backreference — ở giai đoạn input với hành động
block. Pattern tồi bị từ chối lúc lưu, nên một guardrail bạn có thể lưu
luôn biên dịch được.
5. Cũng bắt secret trong phản hồi
Secrets Blocker sàng lọc request. Một preset Secrets riêng, Code Secret in Output, sàng lọc phản hồi của mô hình tìm private key và token kiểu AWS/OpenAI và block cuộc gọi nếu một cái rò lại. block output được thực thi cả hai hướng: trên một phản hồi non-streaming, câu trả lời được sàng lọc trước khi trả về, và trên một phản hồi streaming, một scanner cắt stream trước khi bất kỳ nội dung bị block nào đến được client. Một block giai đoạn output hoàn lại quota đã tiêu trước. Xem quy tắc giai đoạn output và phạm vi streaming.6. Một block trông như thế nào
Một request bị block trả về HTTP 400 với mã lỗiguardrail_blocked
và một thông điệp nêu tên guardrail và quy tắc đã kích hoạt:
guardrail_blocked.
7. Xem cái gì đã kích hoạt
Mỗi quy tắc kích hoạt ghi lại một match — loại quy tắc, hành động, giai đoạn, và một chuỗi chi tiết — hiện ra trong feed Matches của workspace. Bản thân chuỗi con đã match (thông tin xác thực) được ghi lại chỉ khi Log raw content được bật, mà mặc định tắt.8. Đi đâu tiếp theo
Regex detector
Soạn các pattern thông tin xác thực của riêng bạn với quy tắc regex RE2.
Hành động
Chọn block, mask, flag, annotate, hoặc spotlight cho mỗi quy tắc — và block, mask, flag, hoặc annotate cho mỗi entity.
PII Shield
Che email, SSN, và thẻ thành thẻ có kiểu trước khi mô hình thấy chúng.
Tinh chỉnh dương tính giả
Đánh dấu dương tính giả và siết chặt detector từ Matches feed.
