Cosa paghi
OrcaRouter ti addebita il prezzo per token pubblicato dal provider upstream, senza alcun ricarico per token. I ricavi provengono dai piani di abbonamento a pagamento opzionali, non dal gonfiamento del costo dei token.L’oggetto usage
Ogni risposta chat/responses include un campo usage:
completion_tokens_details.reasoning_tokens
per il passaggio di reasoning nascosto.
Addebiti per strumenti built-in
Quando la risposta usa uno strumento built-in / server-side, la chiamata viene contata e fatturata in aggiunta all’uso di token. OrcaRouter trasferisce la tariffa per chiamata del provider upstream senza ricarico; fai riferimento alla pagina di pricing di ciascun provider per le tariffe attuali. Strumenti che generano addebiti per chiamata tra i vari provider:- OpenAI —
web_search,web_search_preview,image_generation(strumenti built-in della Responses API) - Anthropic —
web_search(server tool) - Google Gemini — grounding
googleSearch(per prompt grounded sulla famiglia Gemini 2.x; per query sulla famiglia Gemini 3.x) - xAI Grok —
web_search,x_search,code_interpreter(Agent Tools API su/v1/responses)
| Strumento | Tariffa per chiamata |
|---|---|
web_search | $10 per 1.000 chiamate (unificato tra modelli) |
web_search_preview | 25 / 1k per modelli non-reasoning (gpt-4o*, gpt-4.1*, ecc.) |
Header di risposta OrcaRouter
| Header | Quando viene impostato |
|---|---|
X-Orca-Fallback-Level | Indice del modello di fallback che ha servito la risposta |
X-Orca-Fallback-Model | Nome del modello di fallback |
X-Orca-Router | Nome del router orcarouter/{name} utilizzato |
X-Orca-Resolved-Model | Modello concreto a cui si è risolto un router con nome |
