O que isso significa, concretamente
- Requisições (prompts, mensagens, payloads de chamada de ferramenta, áudio e imagens enviados) são roteadas para o provedor de destino em memória e descartadas assim que a resposta volta.
- Respostas (texto gerado, resultados de ferramentas, imagens geradas, áudio TTS) são transmitidas de volta para você em memória e não escritas em nenhum armazenamento persistente.
- Logs de erro capturam uma mensagem de erro truncada do upstream (ex.: “rate limit exceeded”, “context length exceeded”) para depuração — mas nunca o conteúdo do prompt ou da resposta que disparou o erro.
O que mantemos
Veja Tratamento de dados para a lista completa. Em resumo: timestamps, contagens de tokens, latência e códigos de status HTTP — os metadados necessários para faturar corretamente e detectar abuso. Nunca conteúdo.Por que isso é o padrão (não um opt-in por requisição)
Algumas plataformas de API permitem alternar a retenção por requisição. Tornamos a não-retenção o padrão porque:- A esmagadora maioria dos casos de uso comerciais e pessoais não se beneficia de ter o conteúdo do prompt armazenado.
- Uma flag padrão-ativada é uma superfície de ataque — configurações erradas vazam prompts.
- Zero retenção é um diferenciador em relação ao uso direto do provedor: OpenAI retém 30 dias de logs de abuso; a Anthropic retém de forma similar. O OrcaRouter não adiciona uma segunda camada de retenção sobre isso.
