AKIA..., um .env colado, um agente que
ecoa seu próprio token sk-... — qualquer um deles pode enviar uma credencial
ativa para a OpenAI, Anthropic ou Google em claro, onde ela cai nos logs deles
e nos seus. O Secrets Blocker para isso no gateway: um preset de guardrail
de um clique que varre a requisição em busca de formatos de credencial e
rejeita a chamada com HTTP 400 antes de um único byte deixar seu gateway.
Esta é uma landing focada no caso de uso de vazamento de segredos. Para o motor
completo de guardrail — cada tipo de regra, campo e rota — veja a
referência de Guardrails.
1. Previna fluxos de vazamento de chave de API em LLM em um preset
O objetivo do encanamento deprevenir vazamento de chave de API em LLM é
pegar a credencial antes da chamada upstream, não depois de ela já estar no
log de requisição de um provedor. O preset Secrets Blocker faz exatamente
isso. É um pequeno guardrail de regras de block no estágio de input, cada
uma um regex para um formato de credencial bem conhecido:
Chave de acesso AWS
Chave de acesso AWS
AKIA seguido de 16 caracteres alfanuméricos maiúsculos — o formato
canônico de access-key-id da AWS.Chave secreta estilo OpenAI
Chave secreta estilo OpenAI
Um prefixo
sk- seguido de um corpo de token longo — o formato usado pela
OpenAI e várias chaves de provedor parecidas.Token de acesso pessoal do GitHub
Token de acesso pessoal do GitHub
Um prefixo
ghp_ seguido de um corpo de 36 caracteres./v1/chat/completions exatamente como antes, sem mudança
de SDK e sem redeploy.
Estágio de input, antes da medição. O Secrets Blocker filtra o que você
envia. Uma correspondência rejeita a chamada antes de o modelo ser
invocado, então a credencial nunca chega ao provedor e uma requisição
bloqueada não custa cota. Para também pegar um segredo que um modelo
emite de volta ao cliente, combine-o com um preset de block de output — veja
§5.
2. Aplique o preset no console
Cada passo aqui é uma ação de console no gateway hospedado sob sua própria sessão. Criar e editar guardrails exige Developer+ no workspace. Apenas a chamada/v1/* final usa uma chave de relay sk-orca-....
Abra o template
No console, abra Guardrails, clique no split-button New guardrail e
escolha Secrets & API-Key Blocker na categoria de template
Secrets. Ele semeia as regras de block no estágio de input.
Nomeie e salve
Dê um nome (≤ 64 chars), ex.:
secrets-blocker, e salve. Um preset é uma
semente, não uma trava — adicione ou edite regras livremente depois (veja
§4).Teste-o
Abra a aba Test, cole uma credencial de amostra no estágio
input e
rode a política localmente — sem chamada upstream, sem cota (veja
§3).Vincule uma chave
Edite uma chave de API e escolha
secrets-blocker no menu Guardrail
(define guardrail_id na chave), ou marque-o como o padrão do
workspace. Veja Vincular a uma chave
e Padrão de conta.3. Teste antes de vincular
Prove que a regra dispara antes de qualquer chave apontar para ela. Abra a aba Test dentro do editor, cole uma credencial fictícia, escolha o estágioinput e execute:
4. Estenda a cobertura
O Secrets Blocker cobre os três formatos de maior tráfego. A categoria Secrets traz presets irmãos que você pode aplicar junto, e você pode escrever sua própria regraregex para qualquer token que seu stack emite:
Private Keys & Cloud Tokens
Um preset Secrets companheiro que bloqueia chaves privadas PEM, tokens
do Slack e Stripe, chaves de API do Google e JWTs na requisição.
Crypto Wallet Block
Bloqueia endereços de carteira estilo BTC e ETH na requisição quando eles
nunca deveriam chegar ao provedor.
regex — padrões RE2, tempo
linear, sem backreferences — no estágio input com ação block. Padrões
ruins são rejeitados na hora de salvar, então um guardrail que você consegue
salvar sempre compila.
5. Pegue também segredos na resposta
O Secrets Blocker filtra a requisição. Um preset Secrets separado, Code Secret in Output, filtra a resposta do modelo em busca de chaves privadas e tokens estilo AWS/OpenAI e bloqueia a chamada se um vazar de volta. O block de output é aplicado nos dois sentidos: em uma resposta não-streaming a resposta é filtrada antes de retornar, e em uma resposta streaming um scanner corta o stream antes que qualquer conteúdo bloqueado chegue ao cliente. Um block no estágio de output reembolsa a cota pré-consumida. Veja Regras do estágio de output e Cobertura de streaming.6. Como é um block
Uma requisição bloqueada retorna HTTP 400 com o código de erroguardrail_blocked e uma mensagem nomeando o guardrail e a regra que disparou:
guardrail_blocked.
7. Veja o que disparou
Toda regra que dispara registra um match — tipo de regra, ação, estágio e uma string de detalhe — exibido no feed Matches do workspace. A própria substring correspondente (a credencial) é registrada apenas quando Log raw content está ligado, o que está desligado por padrão.8. Para onde ir a seguir
Detectores regex
Escreva seus próprios padrões de credencial com regras regex RE2.
Ações
Escolha block, mask, flag, annotate ou spotlight por regra — e block, mask, flag ou annotate por entidade.
PII Shield
Mascare emails, SSNs e cartões para tags tipadas antes de o modelo vê-los.
Ajustar falsos positivos
Marque falsos positivos e aperte detectores a partir do feed de Matches.
