A biblioteca de templates de ai guardrail do OrcaRouter: escolha um preset da categoria PII, secrets, compliance, brand, safety, cost ou agent, aplique-o como uma semente, depois edite cada regra livremente antes de vincular uma chave.
Você quer uma política de conteúdo no lugar rápido, sem escrever regexes ou
listas de entidades PII à mão. A biblioteca de templates é o atalho: um
conjunto de presets de guardrail prontos, agrupados por caso de uso, que cada
um semeia uma política funcional em um clique. Escolha um, nomeie-o, e você tem
um conjunto de regras ordenado completo que você pode vincular a uma chave — ou
editar primeiro.Este é um destino focado no caso de uso de preset. Para o motor de guardrail
completo — cada tipo de regra, campo, ação e rota — veja a
referência de Guardrails.
1. O que a biblioteca de templates de ai guardrail te dá
Um preset é um ponto de partida nomeado que solta uma Policy completa
(uma ou mais regras ordenadas) no modal de criação. Os presets são escritos no
servidor, então o seletor do console, o
sandbox Test e estes docs todos
descrevem o mesmo comportamento exato — há uma única fonte de verdade.Todo preset é uma semente, não uma trava. Uma vez que você aplica um, você
é dono da cópia: renomeie-o, adicione ou delete regras, mude a
ação ou o
estágio de uma regra, reajuste um
detector. Nada sobre o template original restringe suas edições.
Aplicar um preset, como toda autoria de guardrail, é uma ação de console sob
sua própria sessão de workspace, e criar ou editar um guardrail exige
Developer+ no workspace. Apenas a chamada de relay final /v1/* usa uma
chave sk-orca-....
O seletor agrupa presets em oito categorias. Cada uma mapeia para um controle
comum que você de outra forma construiria à mão:
PII — redigir ou bloquear dados pessoais
Detecte e mascare (ou bloqueie) emails, telefones, SSNs, cartões, IPs e
mais. Comece com PII Shield para
mascaramento de uma regra, ou um bloqueador estrito quando PII nunca deve
chegar ao provedor.
Secrets — mantenha credenciais fora de prompts
Bloqueie chaves AWS / OpenAI / GitHub, chaves privadas PEM, tokens de nuvem
e endereços de carteira de cripto antes de deixarem o gateway. Veja
Bloquear segredos.
Compliance — rails de dados regulados
Blocks de cartão PCI, blocks de identificador UE/Reino Unido, blocks de
identificador de saúde, e um
compliance logger somente
observação que registra ocorrências de PII sem mudar o tráfego.
Brand — denylists e segurança de marca
Denylists de keyword para palavrões, menções a concorrentes e termos
banidos específicos de região — block ou mask. Veja
Brand safety e
Palavras sensíveis.
Safety — injeção, jailbreak, automutilação
Rails de keyword/regex para frases de prompt-injection, padrões de jailbreak
/ role-play, detecção de vazamento de system-prompt e denylists de
automutilação. Veja
Prompt injection.
Cost — limites de tamanho e comprimento
Limites max_chars no prompt da requisição e na resposta do modelo para
limitar custo e latência. Veja
Cost guardrails.
Agent — filtros de conteúdo agênticos
Filtros de URL, blocks de imagem-markdown (defesa de exfil de imagem),
padrões de shell-injection e filtros de SQL-injection-na-saída para fluxos
de agente. Veja
Guardrails agênticos.
Blocks de atribuição de arquivo .env / segredo, flags de licença
strong-copyleft (GPL / AGPL / LGPL / SSPL) em requisições e output do
modelo, e um aviso não bloqueante que anota prompts que referenciam sinks de
alto risco (eval, os.system, pickle.loads). Veja
Code security.
Presets só semeiam os tipos de regra determinísticos — keyword, regex, PII
e max-chars. Os tipos de regra avançados (fornecedor externo,
LLM judge, contextual grounding) são
adicionados a partir do construtor de regras, não de um template, porque
precisam de uma conexão ou um modelo que você escolhe.
Cada passo aqui é uma ação de console. A chave de relay aparece apenas na
requisição final.
1
Abra o seletor de templates
No console, abra Guardrails e clique no split-button New guardrail.
O seletor abre agrupado pelas oito categorias acima.
2
Escolha um preset
Escolha um — ex.: PII Shield da categoria PII. Ele semeia uma
política completa (aqui, uma única regra pii de mascaramento). O seletor
mostra a descrição de cada preset para que você saiba o que ele faz antes de
aplicá-lo.
3
Nomeie-o e edite livremente
Dê a ele um nome (≤ 64 chars). As regras semeadas agora são suas —
adicione, delete ou reajuste qualquer uma delas. Um preset é uma semente,
não uma trava.
4
Teste antes de vincular
Abra a aba Test, cole uma amostra, escolha um estágio e rode a política
localmente — sem chamada upstream, sem cota. Prove que ela faz o que você
espera antes que qualquer chave aponte para ela.
5
Vincule uma chave
Edite uma chave de API e escolha o guardrail no menu Guardrail (define
guardrail_id na chave), ou marque-o como padrão do workspace. Veja
Vincular a uma chave e
Padrão de conta.
Essa é uma política de mascaramento utilizável de imediato. Mas como o preset é
uma semente, você pode apertá-la imediatamente — por exemplo, trocar duas
entidades para block com um override por entidade para que cartões e SSNs
sejam rejeitados totalmente enquanto o resto é mascarado:
O gateway mascara o email para [EMAIL] antes de encaminhar. Uma requisição
que carrega um número de cartão é rejeitada com HTTP 400guardrail_blocked — que não custa cota (um block de input dispara antes
da medição) e é marcada como skip-retry. Veja o
erro guardrail_blocked.
O preset PII Shield semeia uma regra de mascaramento de estágio both, mas
o mascaramento ao vivo do output do modelo e de respostas com stream está
no roadmap — o mascaramento no estágio de input é o caminho ativo (o gateway
limpa a requisição antes de o modelo vê-la). Para gatear respostas do modelo
hoje, uma regra de block de output é aplicada tanto em streaming quanto em
não-streaming. Veja
Regras de estágio de output e
Cobertura de streaming.
Cada create, update e delete em um guardrail — incluindo o momento em que você
aplica um preset e salva — escreve uma linha de histórico versionada. Você pode
fazer o diff de quaisquer duas versões e reverter para uma anterior,
então editar uma política semeada nunca é uma porta de mão única. Veja
Versionamento.
O preset de mascaramento de PII de um clique, do início ao fim.
Bloquear segredos
O preset Secrets Blocker — pegue chaves e credenciais na requisição.
Guardrails agênticos
Filtros de URL, imagem-markdown, shell e SQL para fluxos de agente.
Referência de Guardrails
O motor completo — cada tipo de regra, campo e rota.
Presets semeiam políticas de conteúdo. Para governar as chamadas de
ferramenta de um agente — negar ações destrutivas, redigir argumentos de
chamada de ferramenta, exigir aprovação — comece com o
Firewall e
Segurança de agentes de IA. Para
como as duas camadas dividem o trabalho, veja
Guardrails vs. Firewall.