429 Too Many Requests con un header Retry-After.
Perché lo scope è il workspace
I workspace sono il modo in cui OrcaRouter raggruppa chiavi, membri e fatturazione che appartengono a un singolo team o individuo. Limiti condivisi all’interno di un workspace rendono il traffico prevedibile man mano che il tuo team cresce: aggiungere una nuova chiave (o un nuovo membro) non moltiplica il tuo budget condiviso. Se hai bisogno di un limite più alto, aggiorna il piano del workspace. OrcaRouter non espone limiti di velocità per modello ai chiamanti — il gateway si comporta come un singolo provider logico dal punto di vista della tua applicazione, in coerenza con l’opacità del provider. Il throttling interno verso i provider upstream avviene in modo trasparente e non fa parte del contratto pubblico.Risposta
Una richiesta limitata restituisce sempre:Retry-After.
Quando è presente un corpo, segue l’envelope compatibile con OpenAI con
error.type impostato a orcarouter_api_error. Il error.message può
essere localizzato (attualmente cinese) — vedi
Errori per la struttura dell’envelope.
Retry-After è in secondi. È la durata della finestra di rate-limit
(conservativo — sicuro attendere esattamente quel tempo); la finestra
successiva avrà il budget pieno. Riprovare immediatamente senza attendere
fallirà di nuovo.
Comportamento client raccomandato
- Su
429, leggiRetry-After. - Attendi quel numero di secondi.
- Riprova la stessa richiesta.
- Se si verifica un secondo
429, aumenta l’attesa di 2× (backoff esponenziale) fino a 60 secondi. - Se vedi
429ripetutamente, considera di suddividere il traffico tra più modelli conextra_body.models— vedi Fallback dei modelli.
Retry-After
automaticamente per impostazione predefinita. Non hai bisogno di codice
personalizzato a meno che tu non abbia disabilitato i retry.
Reattivo, non predittivo
OrcaRouter non restituisce headerX-RateLimit-Remaining / X-RateLimit-Reset,
quindi non puoi controllare preventivamente quanto budget rimane.
Tratta il 429 come segnale — fai backoff quando lo vedi, poi riprendi.