Auto router - OrcaRouter

orcarouter/auto è un router con nome che creiamo per ogni account alla registrazione. Instrada ogni richiesta al modello di chat attivo più economico a cui il tuo account ha accesso, scelto al momento per ciascuna richiesta.

Utilizzo

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)

Nessun’altra configurazione richiesta — il router esiste dal momento in cui il tuo account viene creato.

Comportamento predefinito

La configurazione seed:

Pattern: vuoto — corrisponde a ogni modello di chat a cui il tuo account ha accesso. I nuovi modelli che vengono attivati diventano candidati automaticamente.
Strategia: cheapest — sceglie il modello con il prezzo per token più basso tra i candidati attivi.
Modello predefinito: nessuno. Se il pattern non risolve a nessun modello disponibile, la richiesta fallisce con un errore chiaro. Puoi impostare un predefinito nella dashboard se vuoi una rete di sicurezza.

Puoi vedere e modificare il tuo Auto Router nella dashboard sotto Routing. Puoi restringere il pattern (es. limitarlo a openai/*), cambiare strategia, impostare un default_model o eliminare del tutto il router — come qualsiasi router con nome.

Cambiare strategia

La dashboard espone quattro schede di strategia. Cheapest è il predefinito seed sopra; scegline un’altra per cambiare come orcarouter/auto risolve le scelte:

Scheda	Enum backend	Cosa fa
Cheapest	`cheapest`	Prezzo per token più basso tra i candidati attivi. Il predefinito seed.
Quality	`quality`	Punteggio di qualità più alto tra i candidati attivi, indipendentemente dal prezzo.
Balanced	`balanced`	Sceglie un’opzione a basso costo che soddisfi comunque una soglia di qualità; ricade sull’opzione di qualità più alta se nulla la soddisfa. Predefinito per i nuovi router che crei tu stesso.
Adaptive	`linucb` / `gated_adaptive`	Bandit contestuale LinUCB per router che apprende dal tuo traffico reale per pesare qualità, costo, latenza e affidabilità per richiesta. Due sotto-modalità (Standard / Gated) — vedi Router con nome.

Adaptive necessita di un breve warm-up per modello prima di iniziare a guidare le scelte. Durante il warm-up si comporta come Balanced — questo è atteso, non un bug.

Quando preferire Auto Router ai nomi di modello espliciti

Non vuoi fissarti su un modello specifico; vuoi il modello di chat attivo più economico ad ogni richiesta.
Stai prototipando e non vuoi preoccuparti di quale provider sia attivo.
Vuoi che il routing di OrcaRouter “funzioni e basta” senza pensarci.

Quando preferire nomi di modello espliciti

Hai bisogno di output deterministico — scegliere modelli diversi in momenti diversi cambierà lo stile di generazione e la qualità.
Stai usando funzionalità specifiche di un modello (es. cache_control di Claude, o la generazione nativa di immagini di un modello).
Vuoi un costo per richiesta prevedibile.

Vedere cosa ha scelto l’Auto Router

Controlla l’header di risposta X-Orca-Resolved-Model. Vedi Header di risposta.

res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# e.g. "openai/gpt-4o-mini"

​Utilizzo

​Comportamento predefinito

​Cambiare strategia

​Quando preferire Auto Router ai nomi di modello espliciti

​Quando preferire nomi di modello espliciti

​Vedere cosa ha scelto l’Auto Router