O que você paga
O OrcaRouter cobra de você o preço por token publicado pelo provedor upstream, sem margem por token. A receita vem de planos de assinatura pagos opcionais, não de inflar seu custo por token.O objeto usage
Toda resposta de chat/responses inclui um campo usage:
completion_tokens_details.reasoning_tokens para a passagem oculta
de raciocínio.
Cobranças por ferramentas integradas
Quando a resposta usa uma ferramenta integrada / do lado do servidor, a chamada é contada e faturada acima do uso de tokens. O OrcaRouter repassa a taxa por chamada do provedor upstream sem margem; consulte a página de preços de cada provedor para taxas atuais. Ferramentas que disparam cobranças por chamada entre provedores:- OpenAI —
web_search,web_search_preview,image_generation(ferramentas integradas da Responses API) - Anthropic —
web_search(ferramenta de servidor) - Google Gemini — grounding
googleSearch(por prompt grounded na família Gemini 2.x; por consulta na família Gemini 3.x) - xAI Grok —
web_search,x_search,code_interpreter(API Agent Tools em/v1/responses)
| Ferramenta | Taxa por chamada |
|---|---|
web_search | $10 por 1.000 chamadas (unificado entre modelos) |
web_search_preview | 25 / 1k para modelos não-raciocínio (gpt-4o*, gpt-4.1*, etc.) |
Cabeçalhos de resposta do OrcaRouter
| Cabeçalho | Quando definido |
|---|---|
X-Orca-Fallback-Level | Índice do modelo de fallback que serviu a resposta |
X-Orca-Fallback-Model | Nome do modelo de fallback |
X-Orca-Router | Nome do roteador orcarouter/{name} usado |
X-Orca-Resolved-Model | Modelo concreto para o qual um roteador nomeado resolveu |
