Block rò rỉ secret và thông tin xác thực

Một prompt mang theo một key AKIA..., một .env được dán, một agent dội lại token sk-... của chính nó — bất kỳ cái nào trong số đó có thể gửi một thông tin xác thực còn sống tới OpenAI, Anthropic, hay Google ở dạng rõ, nơi nó đáp xuống log của họ và của bạn. Secrets Blocker chặn điều đó tại gateway: một preset guardrail một-cú-nhấp quét request tìm các hình dạng thông tin xác thực và từ chối cuộc gọi với HTTP 400 trước khi một byte rời gateway của bạn. Đây là trang đích tập trung cho trường hợp dùng rò rỉ secret. Về engine guardrail đầy đủ — mọi loại quy tắc, trường, và route — xem tài liệu tham khảo Guardrails.

1. Ngăn các luồng rò rỉ API key LLM trong một preset

Cả mục đích của hệ thống ngăn rò rỉ API key LLM là bắt thông tin xác thực trước cuộc gọi thượng nguồn, không phải sau khi nó đã ở trong log request của một provider. Preset Secrets Blocker làm chính xác điều đó. Nó là một guardrail nhỏ gồm các quy tắc block giai đoạn input, mỗi cái là một regex cho một hình dạng thông tin xác thực nổi tiếng:

AWS access key

AKIA theo sau bởi 16 ký tự chữ-số viết hoa — hình dạng access-key-id AWS kinh điển.

Secret key kiểu OpenAI

Một tiền tố sk- theo sau bởi một thân token dài — hình dạng được dùng bởi OpenAI và một số provider key trông giống.

GitHub personal access token

Một tiền tố ghp_ theo sau bởi một thân 36 ký tự.

Khi bất kỳ quy tắc nào match, request bị block — gateway không bao giờ chuyển tiếp nó. Chính sách nằm ở gateway, không phải ứng dụng của bạn, nên ứng dụng vẫn gọi /v1/chat/completions y như trước, không đổi SDK và không triển khai lại.

Giai đoạn input, trước khi đo lường. Secrets Blocker sàng lọc những gì bạn gửi. Một match từ chối cuộc gọi trước khi mô hình được gọi, nên thông tin xác thực không bao giờ đến provider và một request bị block không tốn quota. Để cũng bắt một secret mà một mô hình phát lại cho client, ghép nó với một preset block output — xem §5.

2. Áp dụng preset trong console

Mọi bước ở đây là một hành động console trên gateway được lưu trữ dưới phiên của riêng bạn. Tạo và chỉnh sửa guardrails yêu cầu Developer+ trong workspace. Chỉ cuộc gọi /v1/* cuối cùng dùng một relay key sk-orca-....

Mở template

Trong console, mở Guardrails, nhấn split-button New guardrail, và chọn Secrets & API-Key Blocker từ danh mục template Secrets. Nó gieo các quy tắc block giai đoạn input.

Đặt tên và lưu

Đặt cho nó một tên (≤ 64 ký tự), ví dụ secrets-blocker, và lưu. Một preset là một hạt giống, không phải một khóa — thêm hoặc chỉnh sửa quy tắc tự do sau đó (xem §4).

Test nó

Mở tab Test, dán một thông tin xác thực mẫu ở giai đoạn input, và chạy chính sách cục bộ — không có cuộc gọi thượng nguồn, không quota (xem §3).

Gắn một key

Chỉnh sửa một API key và chọn secrets-blocker từ dropdown Guardrail (đặt guardrail_id trên key), hoặc đánh dấu nó là mặc định workspace. Xem Gắn vào một key và Mặc định tài khoản.

3. Test trước khi bạn gắn

Chứng minh quy tắc kích hoạt trước khi bất kỳ key nào trỏ vào nó. Mở tab Test bên trong editor, dán một thông tin xác thực giả, chọn giai đoạn input, và chạy:

Here is my key: AKIAIOSFODNN7EXAMPLE

Sandbox đánh giá chính sách hiện tại cục bộ — không có gì được gửi lên thượng nguồn, không có gì được đo — và trả về verdict block nêu tên quy tắc đã kích hoạt. Để có một lưới A/B đối với một corpus gồm các mẫu secret-bị-rò và lành tính, Eval harness nằm cách một tab.

4. Mở rộng phạm vi

Secrets Blocker bao quát ba hình dạng có traffic cao nhất. Danh mục Secrets có các preset anh em bạn có thể áp dụng song song với nó, và bạn có thể soạn quy tắc regex của riêng mình cho bất kỳ token nào stack của bạn phát hành:

Private Keys & Cloud Tokens

Một preset Secrets đồng hành block các private key PEM, token Slack và Stripe, Google API key, và JWT trên request.

Crypto Wallet Block

Block các địa chỉ ví kiểu BTC và ETH trên request khi chúng không bao giờ nên đến provider.

Để match một định dạng token nội bộ, thêm một quy tắc regex — pattern RE2, thời gian tuyến tính, không backreference — ở giai đoạn input với hành động block. Pattern tồi bị từ chối lúc lưu, nên một guardrail bạn có thể lưu luôn biên dịch được.

Thay vì block, muốn redact một secret bị rò và cho request đi qua đã làm sạch? Dùng một quy tắc pii với một hành động mask — bộ detector built-in bao gồm aws_access_key, api_key_openai, và jwt, mỗi cái render thành một thẻ có kiểu như [AWS_ACCESS_KEY]. Xem Hành động cho block so với mask.

5. Cũng bắt secret trong phản hồi

Secrets Blocker sàng lọc request. Một preset Secrets riêng, Code Secret in Output, sàng lọc phản hồi của mô hình tìm private key và token kiểu AWS/OpenAI và block cuộc gọi nếu một cái rò lại. block output được thực thi cả hai hướng: trên một phản hồi non-streaming, câu trả lời được sàng lọc trước khi trả về, và trên một phản hồi streaming, một scanner cắt stream trước khi bất kỳ nội dung bị block nào đến được client. Một block giai đoạn output hoàn lại quota đã tiêu trước. Xem quy tắc giai đoạn output và phạm vi streaming.

6. Một block trông như thế nào

Một request bị block trả về HTTP 400 với mã lỗi guardrail_blocked và một thông điệp nêu tên guardrail và quy tắc đã kích hoạt:

{
  "error": {
    "code": "guardrail_blocked",
    "message": "request blocked by guardrail \"secrets-blocker\": regex(...)"
  }
}

Request không tốn quota — một block giai đoạn input kích hoạt trước khi đo lường — và được đánh dấu skip-retry, vì chạy lại cùng prompt qua một channel khác sẽ chỉ block lại. Xem lỗi guardrail_blocked.

7. Xem cái gì đã kích hoạt

Mỗi quy tắc kích hoạt ghi lại một match — loại quy tắc, hành động, giai đoạn, và một chuỗi chi tiết — hiện ra trong feed Matches của workspace. Bản thân chuỗi con đã match (thông tin xác thực) được ghi lại chỉ khi Log raw content được bật, mà mặc định tắt.

Đối với một kiểm soát secret, để Log raw content tắt thường là chính điểm: bắt chuỗi con đã match sẽ viết lại thông tin xác thực bị rò thẳng vào telemetry của riêng bạn. Giữ nó tắt trừ khi bạn có một nhu cầu phân loại hẹp, và xoay vòng bất kỳ thông tin xác thực nào bị bắt — một request bị block nghĩa là secret đã bị phơi bày trong một prompt, không phải nó an toàn. Xem Matches feed và Logging & quyền riêng tư.

8. Đi đâu tiếp theo

Regex detector

Soạn các pattern thông tin xác thực của riêng bạn với quy tắc regex RE2.

Hành động

Chọn block, mask, flag, annotate, hoặc spotlight cho mỗi quy tắc — và block, mask, flag, hoặc annotate cho mỗi entity.

PII Shield

Che email, SSN, và thẻ thành thẻ có kiểu trước khi mô hình thấy chúng.

Tinh chỉnh dương tính giả

Đánh dấu dương tính giả và siết chặt detector từ Matches feed.

Secrets Blocker giữ thông tin xác thực khỏi nội dung bạn gửi. Để chặn một agent rò rỉ một secret qua một lời gọi tool — exfiltrate tới một host do kẻ tấn công kiểm soát — dùng Firewall và đọc mối đe dọa data-exfiltration và mối đe dọa rò rỉ secret. Về engine guardrail hoàn chỉnh, xem tài liệu tham khảo Guardrails.

​1. Ngăn các luồng rò rỉ API key LLM trong một preset

​2. Áp dụng preset trong console

​3. Test trước khi bạn gắn

​4. Mở rộng phạm vi

Private Keys & Cloud Tokens

Crypto Wallet Block

​5. Cũng bắt secret trong phản hồi

​6. Một block trông như thế nào

​7. Xem cái gì đã kích hoạt

​8. Đi đâu tiếp theo

Regex detector

Hành động

PII Shield

Tinh chỉnh dương tính giả

1. Ngăn các luồng rò rỉ API key LLM trong một preset

2. Áp dụng preset trong console

3. Test trước khi bạn gắn

4. Mở rộng phạm vi

5. Cũng bắt secret trong phản hồi

6. Một block trông như thế nào

7. Xem cái gì đã kích hoạt

8. Đi đâu tiếp theo