Lo que pagas
OrcaRouter te cobra el precio por token publicado por el proveedor upstream, sin recargo por token. Los ingresos vienen de planes de suscripción de pago opcionales, no de inflar tu coste por token.El objeto usage
Cada respuesta de chat/responses incluye un campo usage:
completion_tokens_details.reasoning_tokens para el pase de
razonamiento oculto.
Cargos de herramientas integradas
Cuando la respuesta usa una herramienta integrada / del lado del servidor, la llamada se cuenta y se factura encima del uso de tokens. OrcaRouter pasa la tasa por llamada del proveedor upstream sin recargo; consulta la página de precios de cada proveedor para las tasas actuales. Herramientas que activan cargos por llamada entre proveedores:- OpenAI —
web_search,web_search_preview,image_generation(herramientas integradas de la API Responses) - Anthropic —
web_search(herramienta de servidor) - Google Gemini — anclaje
googleSearch(por prompt anclado en la familia Gemini 2.x; por consulta en la familia Gemini 3.x) - xAI Grok —
web_search,x_search,code_interpreter(API Agent Tools en/v1/responses)
| Herramienta | Tasa por llamada |
|---|---|
web_search | $10 por 1.000 llamadas (unificado entre modelos) |
web_search_preview | 25 / 1k para modelos no de razonamiento (gpt-4o*, gpt-4.1*, etc.) |
Cabeceras de respuesta OrcaRouter
| Cabecera | Cuándo se establece |
|---|---|
X-Orca-Fallback-Level | Índice del modelo de respaldo que sirvió la respuesta |
X-Orca-Fallback-Model | Nombre del modelo de respaldo |
X-Orca-Router | Nombre del enrutador orcarouter/{name} usado |
X-Orca-Resolved-Model | Modelo concreto al que se resolvió un enrutador nombrado |
