Was du bezahlst
OrcaRouter berechnet dir den vom Upstream-Anbieter veröffentlichten Preis pro Token, ohne Aufschlag pro Token. Die Einnahmen kommen aus optionalen kostenpflichtigen Abonnementplänen, nicht aus dem Aufblähen deiner Token-Kosten.Das usage-Objekt
Jede Chat-/Responses-Antwort enthält ein usage-Feld:
completion_tokens_details.reasoning_tokens
für den versteckten Reasoning-Pass hinzu.
Eingebaute Tool-Gebühren
Wenn die Antwort ein eingebautes / serverseitiges Tool verwendet, wird der Aufruf gezählt und zusätzlich zur Token-Nutzung abgerechnet. OrcaRouter reicht die Rate des Upstream-Anbieters pro Aufruf ohne Aufschlag durch; für aktuelle Raten siehe die Preisseite jedes Anbieters. Tools, die Gebühren pro Aufruf bei verschiedenen Anbietern auslösen:- OpenAI —
web_search,web_search_preview,image_generation(Responses-API-eingebaute Tools) - Anthropic —
web_search(Server-Tool) - Google Gemini —
googleSearch-Grounding (pro gegroundetem Prompt bei der Gemini-2.x-Familie; pro Anfrage bei der Gemini-3.x-Familie) - xAI Grok —
web_search,x_search,code_interpreter(Agent-Tools-API auf/v1/responses)
| Tool | Rate pro Aufruf |
|---|---|
web_search | $10 pro 1.000 Aufrufe (vereinheitlicht über Modelle hinweg) |
web_search_preview | 25 / 1k für Nicht-Reasoning-Modelle (gpt-4o*, gpt-4.1*, usw.) |
OrcaRouter-Antwort-Header
| Header | Wann gesetzt |
|---|---|
X-Orca-Fallback-Level | Index des Fallback-Modells, das die Antwort bediente |
X-Orca-Fallback-Model | Name des Fallback-Modells |
X-Orca-Router | Name des verwendeten orcarouter/{name}-Routers |
X-Orca-Resolved-Model | Konkretes Modell, auf das ein benannter Router auflöste |
