Due modi per impostare l’effort
1. Il campo reasoning_effort (forma OpenAI)
Passalo su una richiesta Chat Completions. Valori: low, medium,
high (e minimal / max su alcuni modelli).
- Famiglia OpenAI o-series e gpt-5-pro: inoltrato come
reasoning_effortnativo. - Anthropic Claude: mappato a
thinking: {type: "enabled", budget_tokens: ...}con budgetlow→1280,medium→2048,high→4096. Perclaude-opus-4.6in particolare, mappato athinking: {type: "adaptive"}piùoutput_config.effort. - Google Gemini: mappato a
generationConfig.thinkingConfigconincludeThoughts: truee un livello di thinking / budget impostato dall’effort. - xAI Grok: inoltrato per la famiglia grok-3-mini (che accetta
reasoning_effortnativamente). - DeepSeek reasoner: il modello è reasoner-by-design;
reasoning_effortè un no-op.
2. Il suffisso -{effort} nel nome del modello
Puoi anche incorporare l’effort nel nome del modello. Suffissi riconosciuti:
-minimal / -low / -medium / -high / -max.
Famiglie di modelli di reasoning in questa distribuzione
OpenAI:openai/o1,o1-proopenai/o3,o3-mini,o3-mini-highopenai/o4-mini,o4-mini-high- famiglia
openai/gpt-5-proegpt-5.x-pro
anthropic/claude-sonnet-4.6,claude-opus-4.6,claude-opus-4.7, ecc. — accoppiali conreasoning_efforto il suffisso-{effort}.
google/gemini-2.5-pro,gemini-2.5-flash,gemini-3-pro-preview, ecc. — accoppiali conreasoning_efforto il suffisso-{effort}.
deepseek/deepseek-reasoner— reasoner-by-design.
grok/grok-4-fast-reasoning,grok-4-1-fast-reasoninggrok/grok-3-miniaccoppiato conreasoning_effort: lowohigh
/v1/models per il catalogo aggiornato.
Traccia di reasoning nella risposta
Per la Responses API di OpenAI il reasoning nascosto del modello viene restituito come elementireasoning nell’output della risposta. Per
Anthropic tramite /v1/messages nativo, il thinking arriva come voci
content_block di tipo thinking. Il gateway espone anche un campo
reasoning_content sulle risposte chat-completion dove l’upstream ne fornisce uno.
Puoi visualizzare la traccia per trasparenza o ignorarla in produzione.
Fatturazione
I token di reasoning sono tracciati separatamente sucompletion_tokens_details .reasoning_tokens nell’oggetto usage della risposta — vedi
Operazioni / Fatturazione e utilizzo.