Vai al contenuto principale
orcarouter/auto è un router con nome che creiamo per ogni account alla registrazione. Instrada ogni richiesta al modello di chat attivo più economico a cui il tuo account ha accesso, scelto al momento per ciascuna richiesta.

Utilizzo

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)
Nessun’altra configurazione richiesta — il router esiste dal momento in cui il tuo account viene creato.

Comportamento predefinito

La configurazione seed:
  • Pattern: vuoto — corrisponde a ogni modello di chat a cui il tuo account ha accesso. I nuovi modelli che vengono attivati diventano candidati automaticamente.
  • Strategia: cheapest — sceglie il modello con il prezzo per token più basso tra i candidati attivi.
  • Modello predefinito: nessuno. Se il pattern non risolve a nessun modello disponibile, la richiesta fallisce con un errore chiaro. Puoi impostare un predefinito nella dashboard se vuoi una rete di sicurezza.
Puoi vedere e modificare il tuo Auto Router nella dashboard sotto Routing. Puoi restringere il pattern (es. limitarlo a openai/*), cambiare strategia, impostare un default_model o eliminare del tutto il router — come qualsiasi router con nome.

Cambiare strategia

La dashboard espone quattro schede di strategia. Cheapest è il predefinito seed sopra; scegline un’altra per cambiare come orcarouter/auto risolve le scelte:
SchedaEnum backendCosa fa
CheapestcheapestPrezzo per token più basso tra i candidati attivi. Il predefinito seed.
QualityqualityPunteggio di qualità più alto tra i candidati attivi, indipendentemente dal prezzo.
BalancedbalancedSceglie un’opzione a basso costo che soddisfi comunque una soglia di qualità; ricade sull’opzione di qualità più alta se nulla la soddisfa. Predefinito per i nuovi router che crei tu stesso.
Adaptivelinucb / gated_adaptiveBandit contestuale LinUCB per router che apprende dal tuo traffico reale per pesare qualità, costo, latenza e affidabilità per richiesta. Due sotto-modalità (Standard / Gated) — vedi Router con nome.
Adaptive necessita di un breve warm-up per modello prima di iniziare a guidare le scelte. Durante il warm-up si comporta come Balanced — questo è atteso, non un bug.

Quando preferire Auto Router ai nomi di modello espliciti

  • Non vuoi fissarti su un modello specifico; vuoi il modello di chat attivo più economico ad ogni richiesta.
  • Stai prototipando e non vuoi preoccuparti di quale provider sia attivo.
  • Vuoi che il routing di OrcaRouter “funzioni e basta” senza pensarci.

Quando preferire nomi di modello espliciti

  • Hai bisogno di output deterministico — scegliere modelli diversi in momenti diversi cambierà lo stile di generazione e la qualità.
  • Stai usando funzionalità specifiche di un modello (es. cache_control di Claude, o la generazione nativa di immagini di un modello).
  • Vuoi un costo per richiesta prevedibile.

Vedere cosa ha scelto l’Auto Router

Controlla l’header di risposta X-Orca-Resolved-Model. Vedi Header di risposta.
res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# e.g. "openai/gpt-4o-mini"