429 Too Many Requests z nagłówkiem Retry-After.
Dlaczego z zakresem workspace
Workspace’y to sposób, w jaki OrcaRouter grupuje klucze, członków i rozliczenia należące do jednego zespołu lub osoby. Współdzielone limity wewnątrz workspace czynią ruch przewidywalnym w miarę rośnięcia zespołu: dodanie nowego klucza (lub nowego członka) nie mnoży Twojego wspólnego budżetu. Jeśli potrzebujesz wyższego pułapu, podnieś plan workspace. OrcaRouter nie wystawia wywołującym rate-limitów per-model — brama zachowuje się jak jeden logiczny dostawca z punktu widzenia Twojej aplikacji, spójnie z nieprzezroczystością dostawcy. Wewnętrzne throttlowanie ku upstreamowym dostawcom dzieje się transparentnie i nie jest częścią publicznego kontraktu.Odpowiedź
Żądanie z przekroczonym limitem zawsze zwraca:Retry-After.
Gdy ciało jest obecne, podąża za kopertą zgodną z OpenAI z polem
error.type ustawionym na orcarouter_api_error. error.message
może być zlokalizowany (obecnie chiński) — zobacz
Błędy dla struktury koperty.
Retry-After jest w sekundach. To czas trwania okna rate-limit
(konserwatywny — bezpiecznie odczekać dokładnie tyle); następne okno
będzie miało pełny budżet. Natychmiastowy retry bez czekania zawiedzie
ponownie.
Zalecane zachowanie klienta
- Przy
429odczytajRetry-After. - Odczekaj tyle sekund.
- Powtórz to samo żądanie.
- Jeśli pojawi się drugi
429, zwiększ oczekiwanie ×2 (exponential backoff) do 60 sekund. - Jeśli widzisz
429wielokrotnie, rozważ podzielenie ruchu między wiele modeli przezextra_body.models— zobacz Fallbacki modeli.
Retry-After
automatycznie. Nie potrzebujesz własnego kodu, chyba że wyłączyłeś
retry.
Reaktywne, nie predykcyjne
OrcaRouter nie zwraca nagłówkówX-RateLimit-Remaining /
X-RateLimit-Reset, więc nie możesz wyprzedzająco sprawdzić, ile
budżetu zostało. Traktuj 429 jako sygnał — wycofaj się, gdy go
widzisz, a potem wznów.