Dwa sposoby ustawienia effort
1. Pole reasoning_effort (kształt OpenAI)
Przekaż je w żądaniu Chat Completions. Wartości: low, medium,
high (oraz minimal / max w niektórych modelach).
- Rodzina OpenAI o-series i gpt-5-pro: przekazane jako natywne
reasoning_effort. - Anthropic Claude: mapowane na
thinking: {type: "enabled", budget_tokens: ...}z budżetamilow→1280,medium→2048,high→4096. Dlaclaude-opus-4.6specyficznie mapowane nathinking: {type: "adaptive"}plusoutput_config.effort. - Google Gemini: mapowane na
generationConfig.thinkingConfigzincludeThoughts: truei poziomem thinking / budżetem ustawionym z effort. - xAI Grok: przekazywane dla rodziny grok-3-mini (która akceptuje
reasoning_effortnatywnie). - DeepSeek reasoner: model jest reasonerem z założenia;
reasoning_effortto no-op.
2. Sufiks -{effort} w nazwie modelu
Możesz też wpisać effort w nazwę modelu. Rozpoznawane sufiksy:
-minimal / -low / -medium / -high / -max.
Rodziny modeli reasoning w tym wdrożeniu
OpenAI:openai/o1,o1-proopenai/o3,o3-mini,o3-mini-highopenai/o4-mini,o4-mini-highopenai/gpt-5-proi rodzinagpt-5.x-pro
anthropic/claude-sonnet-4.6,claude-opus-4.6,claude-opus-4.7itd. — sparuj zreasoning_effortlub sufiksem-{effort}.
google/gemini-2.5-pro,gemini-2.5-flash,gemini-3-pro-previewitd. — sparuj zreasoning_effortlub sufiksem-{effort}.
deepseek/deepseek-reasoner— reasoner z założenia.
grok/grok-4-fast-reasoning,grok-4-1-fast-reasoninggrok/grok-3-minisparowany zreasoning_effort: lowlubhigh
/v1/models, aby zobaczyć aktualny katalog.
Ślad reasoning w odpowiedzi
Dla OpenAI Responses API ukryty reasoning modelu jest zwracany jako elementyreasoning w output odpowiedzi. Dla Anthropic przez natywne
/v1/messages, thinking przychodzi jako wpisy content_block typu
thinking. Brama również udostępnia pole reasoning_content na
odpowiedziach chat-completion, gdzie upstream je udostępnia.
Możesz wyświetlać ślad dla przejrzystości lub ignorować go na produkcji.
Rozliczenia
Tokeny reasoning są śledzone osobno nacompletion_tokens_details .reasoning_tokens w obiekcie usage odpowiedzi — zobacz
Operacje / Rozliczenia i zużycie.