1. A checklist de menor agência
Passe cada chave — nova ou existente — por estes seis portões no editor de chaves (/console/token). Definir qualquer um deles exige o papel de
Developer ou superior; os dois planos de política (§5–6) são criados
separadamente e vinculados aqui.
model_limits — fixe os modelos
model_limits — fixe os modelos
Defina
model_limits para a lista exata que este agente precisa (e habilite
model_limits_enabled). Uma chamada a qualquer modelo fora da lista é
rejeitada antes de sair do gateway, então um agente sequestrado não pode
escalar para um modelo mais caro ou mais capaz.
Verifique: a lista é tão curta quanto o trabalho permite — idealmente um
modelo? Profundidade: Limites de modelo.allow_ips — fixe a origem
allow_ips — fixe a origem
Defina
allow_ips para os endereços de origem ou CIDR de onde o agente de
fato chama. Uma chave vazada apresentada de qualquer outro lugar é rejeitada
na camada de auth. Vazio significa que todos os IPs são permitidos.
Verifique: para um agente de host fixo ou agendado, a lista é não-vazia
e escopada para aquele egress? Profundidade:
Lista de permissão de IP.credit_limit_usd — limite o gasto
credit_limit_usd — limite o gasto
Defina
credit_limit_usd para um teto que o agente nunca deveria cruzar em
sua vida. O gateway o aplica contra o gasto da chave. 0 significa
ilimitado — um loop descontrolado pode drenar todo o seu saldo.
Verifique: o limite é um orçamento real, não 0? Profundidade:
Cota, limite & expiração.expired_time — dê a ela um prazo
expired_time — dê a ela um prazo
Defina
expired_time para uma expiração absoluta — o fim do sprint, do
deployment ou do run de CI. -1 significa nunca expira. Uma chave de
curta duração não pode persistir como superfície de ataque esquecida.
Verifique: uma chave efêmera ou de contratado tem uma expiração real,
não -1? Profundidade:
Chaves expiráveis.guardrail_id — vincule uma política de conteúdo
guardrail_id — vincule uma política de conteúdo
Anexe um guardrail via
guardrail_id para que o
texto da requisição (e, onde suportado, da resposta) seja filtrado em busca
de PII, segredos e intenção de injeção antes de chegar ao modelo.
Verifique: uma chave que lida com prompts sensíveis tem um guardrail
vinculado, ou herda um padrão de workspace? Veja §5.firewall_policy_id — vincule uma política de ferramenta
firewall_policy_id — vincule uma política de ferramenta
Anexe uma política de firewall via
firewall_policy_id para que cada chamada de ferramenta, dispatch de MCP e
egress que esta chave emite seja avaliada contra uma lista de permissão do
que o agente legitimamente precisa.
Verifique: um agente que chama ferramentas tem uma política de firewall
vinculada, ou herda o padrão do workspace? Veja §6.2. O quê / com que frequência / onde
Três perguntas transformam a checklist de uma tarefa única em uma postura.O quê
Os seis portões acima, em ordem:
model_limits → allow_ips →
credit_limit_usd → expired_time → guardrail_id →
firewall_policy_id.Com que frequência
Em cada chave na criação, e em uma revisão recorrente — quando o
escopo de um agente muda, quando você rotaciona
uma chave, e em uma cadência fixa para chaves de longa duração.
Onde
No editor de chaves do console (
/console/token), como um Developer+. As
duas políticas são criadas em seus próprios consoles, depois vinculadas na
chave.3. Uma chave de menor agência concreta
Um agente agendado que resume tickets de suporte com um modelo barato, a partir de um único host, quase não precisa de agência. Uma chave totalmente endurecida:| Campo | Valor | Por quê |
|---|---|---|
model_limits | um modelo de sumarização | não pode escalar para um modelo de fronteira |
allow_ips | o CIDR de egress do agendador | uma chave vazada é inútil em outro lugar |
credit_limit_usd | um teto semanal | um loop descontrolado não pode drenar o saldo |
expired_time | fim do deployment | autoexpira, não pode persistir |
guardrail_id | um guardrail de mascaramento de PII | o texto da requisição é filtrado |
firewall_policy_id | permite por lista apenas suas ferramentas | nenhuma chamada de ferramenta surpresa |
4. A chamada de relay /v1 vs o console
A checklist é configurada no console com sua sessão (um usuário Developer+). Seu agente nunca toca essas rotas de config — ele apresenta sua chave de relay com escopo (sk-orca-…) nas chamadas de inferência /v1/*, e os
limites e políticas vinculadas acima são aplicados em cada uma.
model_limits da chave não inclui openai/gpt-4o-mini, esta chamada é
rejeitada antes de sair do gateway. Se o IP do chamador não está em
allow_ips, ela é rejeitada na camada de auth. O código do agente permanece o
mesmo; a chave decide o raio de explosão.
5. Portão 5 — o guardrail vinculado
guardrail_id vincula uma política de conteúdo ordenada e com escopo de
workspace à chave. A resolução é o guardrail explícito da chave (se ele existe e
está habilitado), senão o padrão do workspace, senão nenhum.
Os guardrails são um interruptor de desligar estrito quando desabilitados:
um
guardrail_id desabilitado ou deletado significa que a chave não recebe
nenhum guardrail — ela não cai de volta para o padrão do workspace. Isto
é o oposto do plano de firewall (§6), então verifique que o guardrail vinculado
está habilitado, não apenas anexado.block, mask ou
flag. O preset PII Shield, por exemplo, mascara PII na requisição antes de
ela sequer chegar ao modelo. Crie e anexe guardrails como Developer+ — veja
Guardrails e
Vincular políticas.
6. Portão 6 — a política de firewall vinculada + escopo de gateway
firewall_policy_id vincula uma política de chamada de ferramenta com
escopo de workspace. Ela governa as ações que um agente toma — ferramentas
anunciadas, tool_calls emitidos pelo modelo, dispatches de MCP e egress
outbound — contra uma lista de regras ordenada cujos vereditos são allow,
audit, deny, sanitize, pending_approval ou cap_cost.
O plano de firewall resolve diferentemente dos guardrails: uma política de
firewall anexada desabilitada cai de volta para o padrão do workspace, ela
não desliga o enforcement. Então vincular uma política e desabilitá-la reverte a
chave ao padrão do workspace — ela nunca fica silenciosamente desprotegida.
tight / balanced /
permissive), com desfazer em um clique. Veja
Firewall §8.
7. Após a checklist
Linha de base de agentes seguros
A postura inicial recomendada — um interruptor de autonomia, depois ajuste a
partir do tráfego real.
Vincular políticas
Como
guardrail_id e firewall_policy_id se anexam e resolvem.Agência excessiva
A ameaça que esta checklist foi feita para conter.
Chave vazada
O que fazer no momento em que uma chave com escopo é exposta.
