Bloqueie vazamento de segredos e credenciais

Um prompt que carrega uma chave AKIA..., um .env colado, um agente que ecoa seu próprio token sk-... — qualquer um deles pode enviar uma credencial ativa para a OpenAI, Anthropic ou Google em claro, onde ela cai nos logs deles e nos seus. O Secrets Blocker para isso no gateway: um preset de guardrail de um clique que varre a requisição em busca de formatos de credencial e rejeita a chamada com HTTP 400 antes de um único byte deixar seu gateway. Esta é uma landing focada no caso de uso de vazamento de segredos. Para o motor completo de guardrail — cada tipo de regra, campo e rota — veja a referência de Guardrails.

1. Previna fluxos de vazamento de chave de API em LLM em um preset

O objetivo do encanamento de prevenir vazamento de chave de API em LLM é pegar a credencial antes da chamada upstream, não depois de ela já estar no log de requisição de um provedor. O preset Secrets Blocker faz exatamente isso. É um pequeno guardrail de regras de block no estágio de input, cada uma um regex para um formato de credencial bem conhecido:

Chave de acesso AWS

AKIA seguido de 16 caracteres alfanuméricos maiúsculos — o formato canônico de access-key-id da AWS.

Chave secreta estilo OpenAI

Um prefixo sk- seguido de um corpo de token longo — o formato usado pela OpenAI e várias chaves de provedor parecidas.

Token de acesso pessoal do GitHub

Um prefixo ghp_ seguido de um corpo de 36 caracteres.

Quando qualquer regra corresponde, a requisição é bloqueada — o gateway nunca a encaminha. A política vive no gateway, não na sua aplicação, então sua app continua chamando /v1/chat/completions exatamente como antes, sem mudança de SDK e sem redeploy.

Estágio de input, antes da medição. O Secrets Blocker filtra o que você envia. Uma correspondência rejeita a chamada antes de o modelo ser invocado, então a credencial nunca chega ao provedor e uma requisição bloqueada não custa cota. Para também pegar um segredo que um modelo emite de volta ao cliente, combine-o com um preset de block de output — veja §5.

2. Aplique o preset no console

Cada passo aqui é uma ação de console no gateway hospedado sob sua própria sessão. Criar e editar guardrails exige Developer+ no workspace. Apenas a chamada /v1/* final usa uma chave de relay sk-orca-....

Abra o template

No console, abra Guardrails, clique no split-button New guardrail e escolha Secrets & API-Key Blocker na categoria de template Secrets. Ele semeia as regras de block no estágio de input.

Nomeie e salve

Dê um nome (≤ 64 chars), ex.: secrets-blocker, e salve. Um preset é uma semente, não uma trava — adicione ou edite regras livremente depois (veja §4).

Teste-o

Abra a aba Test, cole uma credencial de amostra no estágio input e rode a política localmente — sem chamada upstream, sem cota (veja §3).

Vincule uma chave

Edite uma chave de API e escolha secrets-blocker no menu Guardrail (define guardrail_id na chave), ou marque-o como o padrão do workspace. Veja Vincular a uma chave e Padrão de conta.

3. Teste antes de vincular

Prove que a regra dispara antes de qualquer chave apontar para ela. Abra a aba Test dentro do editor, cole uma credencial fictícia, escolha o estágio input e execute:

Here is my key: AKIAIOSFODNN7EXAMPLE

O sandbox avalia a política atual localmente — nada é enviado upstream, nada é medido — e retorna o veredito de block nomeando a regra que disparou. Para uma grade A/B contra um corpus de amostras de segredos vazados e benignas, o Eval harness fica a uma aba de distância.

4. Estenda a cobertura

O Secrets Blocker cobre os três formatos de maior tráfego. A categoria Secrets traz presets irmãos que você pode aplicar junto, e você pode escrever sua própria regra regex para qualquer token que seu stack emite:

Private Keys & Cloud Tokens

Um preset Secrets companheiro que bloqueia chaves privadas PEM, tokens do Slack e Stripe, chaves de API do Google e JWTs na requisição.

Crypto Wallet Block

Bloqueia endereços de carteira estilo BTC e ETH na requisição quando eles nunca deveriam chegar ao provedor.

Para corresponder a um formato de token interno, adicione uma regra regex — padrões RE2, tempo linear, sem backreferences — no estágio input com ação block. Padrões ruins são rejeitados na hora de salvar, então um guardrail que você consegue salvar sempre compila.

Em vez de bloquear, quer redigir um segredo vazado e deixar a requisição passar sanitizada? Use uma regra pii com uma ação mask — o conjunto de detectores embutidos inclui aws_access_key, api_key_openai e jwt, cada um renderizando para uma tag tipada como [AWS_ACCESS_KEY]. Veja Ações para block vs. mask.

5. Pegue também segredos na resposta

O Secrets Blocker filtra a requisição. Um preset Secrets separado, Code Secret in Output, filtra a resposta do modelo em busca de chaves privadas e tokens estilo AWS/OpenAI e bloqueia a chamada se um vazar de volta. O block de output é aplicado nos dois sentidos: em uma resposta não-streaming a resposta é filtrada antes de retornar, e em uma resposta streaming um scanner corta o stream antes que qualquer conteúdo bloqueado chegue ao cliente. Um block no estágio de output reembolsa a cota pré-consumida. Veja Regras do estágio de output e Cobertura de streaming.

6. Como é um block

Uma requisição bloqueada retorna HTTP 400 com o código de erro guardrail_blocked e uma mensagem nomeando o guardrail e a regra que disparou:

{
  "error": {
    "code": "guardrail_blocked",
    "message": "request blocked by guardrail \"secrets-blocker\": regex(...)"
  }
}

A requisição não custa cota — um block no estágio de input dispara antes da medição — e é marcada como skip-retry, já que reexecutar o mesmo prompt contra outro canal apenas bloquearia de novo. Veja o erro guardrail_blocked.

7. Veja o que disparou

Toda regra que dispara registra um match — tipo de regra, ação, estágio e uma string de detalhe — exibido no feed Matches do workspace. A própria substring correspondente (a credencial) é registrada apenas quando Log raw content está ligado, o que está desligado por padrão.

Para um controle de segredos, deixar Log raw content desligado costuma ser o ponto: capturar a substring correspondente reescreveria a credencial vazada direto na sua própria telemetria. Mantenha-o desligado a menos que você tenha uma necessidade estreita de triagem, e rotacione qualquer credencial que foi pega — uma requisição bloqueada significa que o segredo foi exposto em um prompt, não que está seguro. Veja Feed de matches e Logging e privacidade.

8. Para onde ir a seguir

Detectores regex

Escreva seus próprios padrões de credencial com regras regex RE2.

Ações

Escolha block, mask, flag, annotate ou spotlight por regra — e block, mask, flag ou annotate por entidade.

PII Shield

Mascare emails, SSNs e cartões para tags tipadas antes de o modelo vê-los.

Ajustar falsos positivos

Marque falsos positivos e aperte detectores a partir do feed de Matches.

O Secrets Blocker mantém credenciais fora do conteúdo que você envia. Para impedir um agente de vazar um segredo por uma chamada de ferramenta — exfiltrando para um host controlado por um atacante — use o Firewall e leia a ameaça de exfiltração de dados e a ameaça de vazamento de segredos. Para o motor completo de guardrail, veja a referência de Guardrails.

​1. Previna fluxos de vazamento de chave de API em LLM em um preset

​2. Aplique o preset no console

​3. Teste antes de vincular

​4. Estenda a cobertura

Private Keys & Cloud Tokens

Crypto Wallet Block

​5. Pegue também segredos na resposta

​6. Como é um block

​7. Veja o que disparou

​8. Para onde ir a seguir

Detectores regex

Ações

PII Shield

Ajustar falsos positivos

1. Previna fluxos de vazamento de chave de API em LLM em um preset

2. Aplique o preset no console

3. Teste antes de vincular

4. Estenda a cobertura

5. Pegue também segredos na resposta

6. Como é um block

7. Veja o que disparou

8. Para onde ir a seguir