Saltar al contenido principal
orcarouter/auto es un enrutador nombrado que creamos para cada cuenta al registrarse. Enruta cada solicitud al modelo chat en vivo más barato al que tu cuenta tiene acceso, elegido de nuevo por solicitud.

Uso

response = client.chat.completions.create(
    model="orcarouter/auto",
    messages=[{"role": "user", "content": "..."}],
)
No se requiere otra configuración — el enrutador existe en el momento en que se crea tu cuenta.

Comportamiento por defecto

La configuración semilla:
  • Patrón: vacío — coincide con cada modelo chat al que tu cuenta tiene acceso. Los nuevos modelos que se ponen en línea se convierten automáticamente en candidatos.
  • Estrategia: cheapest — elige el modelo con el precio por token más bajo entre los candidatos en vivo.
  • Modelo por defecto: ninguno. Si el patrón se resuelve a ningún modelo disponible, la solicitud falla con un error claro. Puedes configurar un por defecto en el panel si quieres una red de seguridad.
Puedes ver y editar tu Enrutador Automático en el panel bajo Routing. Puedes estrechar el patrón (p. ej. restringir a openai/*), cambiar la estrategia, configurar un default_model, o eliminar el enrutador por completo — igual que cualquier enrutador nombrado.

Cambiar estrategias

El panel expone cuatro tarjetas de estrategia. Cheapest es el por defecto sembrado de arriba; elige otro para cambiar cómo orcarouter/auto resuelve las elecciones:
TarjetaEnum de backendLo que hace
CheapestcheapestPrecio por token más bajo entre candidatos en vivo. El por defecto sembrado.
QualityqualityPuntuación de calidad más alta entre candidatos en vivo, sin importar el precio.
BalancedbalancedElige una opción de bajo coste que aún cumple un umbral de calidad; recurre a la opción de mayor calidad si nada cumple el umbral. Por defecto para nuevos enrutadores que tú creas.
Adaptivelinucb / gated_adaptiveBandido contextual LinUCB por enrutador que aprende de tu tráfico real para ponderar calidad, coste, latencia y fiabilidad por solicitud. Dos sub-modos (Standard / Gated) — ver Enrutadores nombrados.
Adaptive necesita un breve calentamiento por modelo antes de empezar a dirigir las elecciones. Durante el calentamiento se comporta como Balanced — eso es esperado, no un bug.

Cuándo preferir Enrutador Automático sobre nombres de modelo explícitos

  • No quieres fijarte a un modelo específico; quieres el modelo chat en vivo más barato en cada solicitud.
  • Estás prototipando y no quieres preocuparte por qué proveedor está arriba.
  • Quieres que el enrutamiento de OrcaRouter “simplemente funcione” sin pensar en ello.

Cuándo preferir nombres de modelo explícitos

  • Necesitas salida determinista — elegir diferentes modelos en diferentes momentos cambiará el estilo y calidad de generación.
  • Estás usando funciones específicas de un modelo (p. ej. cache_control de Claude, o generación de imagen nativa de un modelo).
  • Quieres coste predecible por solicitud.

Ver lo que eligió el Enrutador Automático

Consulta la cabecera de respuesta X-Orca-Resolved-Model. Ver Cabeceras de respuesta.
res = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto", ...
)
actual_model = res.headers.get("X-Orca-Resolved-Model")
# p. ej. "openai/gpt-4o-mini"