Co to oznacza konkretnie
- Żądania (prompty, wiadomości, payloady wywołań narzędzi, wgrywane audio i obrazy) są routowane do docelowego dostawcy w pamięci i odrzucane, gdy tylko wróci odpowiedź.
- Odpowiedzi (wygenerowany tekst, wyniki narzędzi, wygenerowane obrazy, audio TTS) są strumieniowane z powrotem do Ciebie w pamięci i nie są zapisywane w żadnym trwałym magazynie.
- Logi błędów zawierają obcięty komunikat błędu z upstream (np. “rate limit exceeded”, “context length exceeded”) do debugowania — ale nigdy prompt ani zawartości odpowiedzi, które wywołały błąd.
Co trzymamy
Zobacz Obsługa danych, aby znaleźć pełną listę. W skrócie: znaczniki czasu, liczby tokenów, latencja i kody statusu HTTP — metadane konieczne do poprawnego rozliczenia i wykrywania nadużyć. Nigdy treść.Dlaczego to domyślne (nie opt-in per żądanie)
Niektóre platformy API pozwalają przełączać retencję per żądanie. Uczyniliśmy nie-retencję domyślną, ponieważ:- Przytłaczająca większość zastosowań komercyjnych i prywatnych nie korzysta z przechowywania zawartości promptów.
- Domyślnie włączona flaga to powierzchnia ataku — błędna konfiguracja wycieka prompty.
- Zero retencji to wyróżnik względem bezpośredniego użycia dostawców: OpenAI trzyma 30 dni logów nadużyć; Anthropic trzyma podobnie. OrcaRouter nie dodaje drugiej warstwy retencji na wierzchu.
