Redija PII com o PII Shield

Você quer manter dados pessoais fora do modelo upstream. Um cliente cola um endereço de email, um transcript de suporte carrega um número de cartão, um prompt de agente vaza um SSN — e nada disso deveria chegar à OpenAI, Anthropic ou Google em claro. O PII Shield é a forma mais rápida de resolver isso: um preset de guardrail de uma regra que detecta entidades sensíveis na requisição e mascara cada uma para uma tag tipada antes de o gateway encaminhar a chamada. Esta é uma landing focada no caso de uso de mascaramento de PII. Para o motor completo de guardrail — cada tipo de regra, campo e rota — veja a referência de Guardrails.

1. Caso de uso de redação de PII em LLM em uma regra

A parte difícil do encanamento de redação de PII em LLM costuma ser o próprio encanamento. O PII Shield o remove. O preset é uma única regra pii:

Tipo: PII detection (pii)
Ação: Mask — substitui cada correspondência por uma tag tipada
Entidades: email, phone, ssn, credit_card, ip

Aplique-o uma vez no console, vincule-o a uma chave, e cada chamada nessa chave é filtrada sem mudança de SDK e sem redeploy. A política vive no gateway, não na sua aplicação — sua app continua chamando /v1/chat/completions exatamente como antes.

O mascaramento no estágio de input é o caminho ativo. O PII Shield mascara a requisição antes de ela deixar o gateway, então o modelo upstream nunca vê o valor original. O mascaramento ao vivo do output do modelo e de respostas com stream está no roadmap; enquadre o PII Shield como limpando o que você envia, não o que volta. Para gatear as respostas do modelo hoje, uma regra de block de output é aplicada nos dois sentidos — veja Regras do estágio de output e Cobertura de streaming.

2. Aplique o preset no console

Cada passo aqui é uma ação de console no gateway hospedado sob sua própria sessão. Criar e editar guardrails exige Developer+ no workspace. Apenas a chamada /v1/* final usa uma chave de relay sk-orca-....

Abra o template

No console, abra Guardrails, clique no split-button New guardrail e escolha PII Shield na categoria de template PII. Ele semeia uma única regra pii de mascaramento.

Nomeie e salve

Dê um nome (≤ 64 chars), ex.: pii-shield, e salve. Um preset é uma semente, não uma trava — edite a lista de entidades ou a ação livremente depois.

Teste-o

Abra a aba Test, cole uma amostra no estágio input e rode a política localmente — sem chamada upstream, sem cota (veja §4).

Vincule uma chave

Edite uma chave de API e escolha pii-shield no menu Guardrail (define guardrail_id na chave), ou marque-o como o padrão do workspace. Veja Vincular a uma chave e Padrão de conta.

3. O que é mascarado, e para quê

Em uma ação mask cada correspondência é substituída por uma tag tipada — um email vira [EMAIL], um SSN vira [SSN]. O conjunto de detectores embutidos é fechado e compartilhado pelo motor, pelo sandbox e pelo construtor de regras:

Entidades embutidas

email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.

Identificadores regionais

jp_mynumber (My Number do Japão → [JP_MYNUMBER]), kr_rrn (RRN da Coreia → [KR_RRN]) e cn_resident_id (ID de residente da China → [CN_RESIDENT_ID]). Habilite os que correspondem à sua jurisdição.

Suas próprias entidades personalizadas

Empilhe um detector regex sobre os embutidos — um employee_id, um número de conta interno — com um checksum luhn opcional e uma substituição personalizada. Até 25 por regra. Veja Entidades de PII personalizadas e Formatos de mascaramento.

Uma regra PII pode aplicar ações diferentes a entidades diferentes via entity_actions — mascarar email / phone / ip, mas block em credit_card ou ssn. Sem necessidade de regras sobrepostas. Veja Ações.

4. Teste antes de vincular

Prove que a regra faz o que você espera antes de qualquer chave apontar para ela. Abra a aba Test dentro do editor, cole uma amostra, escolha o estágio input e execute:

Reply to jane@acme.com please

O sandbox avalia a política atual localmente e retorna o veredito mais o texto renderizado — nada é enviado upstream, nada é medido:

Reply to [EMAIL] please

Para uma grade A/B contra um corpus, o Eval harness fica a uma aba de distância.

5. Envie uma requisição

Usando uma chave vinculada a pii-shield, chame o OrcaRouter exatamente como antes — sem novos headers, sem mudança de SDK:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'

O gateway mascara o email para [EMAIL] antes de encaminhar — o modelo upstream recebe Reply to [EMAIL] please e nunca vê o endereço.

Troque a ação de uma entidade para block (via override por entidade) e a próxima requisição que carregar essa entidade é rejeitada com HTTP 400 guardrail_blocked. Uma requisição bloqueada não custa cota (um block de input dispara antes da medição) e é marcada como skip-retry. Veja o erro guardrail_blocked.

6. Veja o que disparou

Toda regra que dispara registra um match — tipo de regra, ação, estágio e uma string de detalhe — exibido no feed Matches do workspace. A própria substring correspondente (o endereço de email real) é registrada apenas quando Log raw content está ligado, o que está desligado por padrão — a postura conservadora de privacidade que mantém PII redigida fora da sua própria telemetria também.

Para um controle de redação, deixar Log raw content desligado costuma ser o ponto: você consegue ver que um email foi mascarado e com que frequência, sem recapturar o valor que você acabou de limpar. Ligue-o por guardrail apenas quando precisar da substring para triagem; a configuração não é retroativa. Veja Feed de matches e Logging e privacidade.

7. Para onde ir a seguir

Entidades de PII personalizadas

Adicione seus próprios detectores regex com checks de Luhn opcionais, até 25 por regra.

Formatos de mascaramento

Controle a tag tipada para a qual cada entidade é renderizada.

Bloquear segredos

Pegue chaves de API e credenciais com o preset Secrets Blocker.

Ajustar falsos positivos

Marque falsos positivos e aperte detectores a partir do feed de Matches.

O PII Shield mascara conteúdo. Para governar as chamadas de ferramenta de um agente — negar ações destrutivas, redigir argumentos de chamadas de ferramenta, exigir aprovação — use o Firewall. Comece com Segurança de agentes de IA e a ameaça de exfiltração de dados, ou leia a referência de Guardrails para o motor completo.

erro guardrail_blocked Entidades de PII personalizadas

​1. Caso de uso de redação de PII em LLM em uma regra

​2. Aplique o preset no console

​3. O que é mascarado, e para quê

​4. Teste antes de vincular

​5. Envie uma requisição

​6. Veja o que disparou

​7. Para onde ir a seguir

Entidades de PII personalizadas

Formatos de mascaramento

Bloquear segredos

Ajustar falsos positivos

1. Caso de uso de redação de PII em LLM em uma regra

2. Aplique o preset no console

3. O que é mascarado, e para quê

4. Teste antes de vincular

5. Envie uma requisição

6. Veja o que disparou

7. Para onde ir a seguir