1. Caso de uso de redação de PII em LLM em uma regra
A parte difícil do encanamento deredação de PII em LLM costuma ser o
próprio encanamento. O PII Shield o remove. O preset é uma única regra
pii:
- Tipo: PII detection (
pii) - Ação: Mask — substitui cada correspondência por uma tag tipada
- Entidades:
email,phone,ssn,credit_card,ip
/v1/chat/completions exatamente
como antes.
O mascaramento no estágio de input é o caminho ativo. O PII Shield mascara
a requisição antes de ela deixar o gateway, então o modelo upstream nunca
vê o valor original. O mascaramento ao vivo do output do modelo e de
respostas com stream está no roadmap; enquadre o PII Shield como limpando o
que você envia, não o que volta. Para gatear as respostas do modelo hoje,
uma regra de block de output é aplicada nos dois sentidos — veja
Regras do estágio de output e
Cobertura de streaming.
2. Aplique o preset no console
Cada passo aqui é uma ação de console no gateway hospedado sob sua própria sessão. Criar e editar guardrails exige Developer+ no workspace. Apenas a chamada/v1/* final usa uma chave de relay sk-orca-....
Abra o template
No console, abra Guardrails, clique no split-button New guardrail e
escolha PII Shield na categoria de template PII. Ele semeia uma
única regra
pii de mascaramento.Nomeie e salve
Dê um nome (≤ 64 chars), ex.:
pii-shield, e salve. Um preset é uma
semente, não uma trava — edite a lista de entidades ou a ação livremente
depois.Teste-o
Abra a aba Test, cole uma amostra no estágio
input e rode a política
localmente — sem chamada upstream, sem cota (veja
§4).Vincule uma chave
Edite uma chave de API e escolha
pii-shield no menu Guardrail
(define guardrail_id na chave), ou marque-o como o padrão do
workspace. Veja Vincular a uma chave
e Padrão de conta.3. O que é mascarado, e para quê
Em uma ação mask cada correspondência é substituída por uma tag tipada — um email vira[EMAIL], um SSN vira [SSN]. O conjunto de detectores
embutidos é fechado e compartilhado pelo motor, pelo sandbox e pelo construtor
de regras:
Entidades embutidas
Entidades embutidas
email, phone, credit_card, ssn, ip, iban,
mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address.Identificadores regionais
Identificadores regionais
jp_mynumber (My Number do Japão → [JP_MYNUMBER]), kr_rrn (RRN da
Coreia → [KR_RRN]) e cn_resident_id (ID de residente da China →
[CN_RESIDENT_ID]). Habilite os que correspondem à sua jurisdição.Suas próprias entidades personalizadas
Suas próprias entidades personalizadas
Empilhe um detector regex sobre os embutidos — um
employee_id, um número
de conta interno — com um checksum luhn opcional e uma substituição
personalizada. Até 25 por regra. Veja
Entidades de PII personalizadas e
Formatos de mascaramento.4. Teste antes de vincular
Prove que a regra faz o que você espera antes de qualquer chave apontar para ela. Abra a aba Test dentro do editor, cole uma amostra, escolha o estágioinput e execute:
5. Envie uma requisição
Usando uma chave vinculada apii-shield, chame o OrcaRouter exatamente como
antes — sem novos headers, sem mudança de SDK:
[EMAIL] antes de encaminhar — o modelo
upstream recebe Reply to [EMAIL] please e nunca vê o endereço.
6. Veja o que disparou
Toda regra que dispara registra um match — tipo de regra, ação, estágio e uma string de detalhe — exibido no feed Matches do workspace. A própria substring correspondente (o endereço de email real) é registrada apenas quando Log raw content está ligado, o que está desligado por padrão — a postura conservadora de privacidade que mantém PII redigida fora da sua própria telemetria também.Para um controle de redação, deixar Log raw content desligado costuma ser
o ponto: você consegue ver que um
email foi mascarado e com que
frequência, sem recapturar o valor que você acabou de limpar. Ligue-o por
guardrail apenas quando precisar da substring para triagem; a configuração não
é retroativa. Veja Feed de matches e
Logging e privacidade.7. Para onde ir a seguir
Entidades de PII personalizadas
Adicione seus próprios detectores regex com checks de Luhn opcionais, até
25 por regra.
Formatos de mascaramento
Controle a tag tipada para a qual cada entidade é renderizada.
Bloquear segredos
Pegue chaves de API e credenciais com o preset Secrets Blocker.
Ajustar falsos positivos
Marque falsos positivos e aperte detectores a partir do feed de Matches.
