Два способа задать effort
1. Поле reasoning_effort (формат OpenAI)
Передавайте его в запросе Chat Completions. Значения: low, medium,
high (а также minimal / max на некоторых моделях).
- Серия o от OpenAI и семейство gpt-5-pro: пробрасывается как
нативный
reasoning_effort. - Anthropic Claude: отображается в
thinking: {type: "enabled", budget_tokens: ...}с бюджетамиlow→1280,medium→2048,high→4096. Дляclaude-opus-4.6конкретно отображается вthinking: {type: "adaptive"}плюсoutput_config.effort. - Google Gemini: отображается в
generationConfig.thinkingConfigсincludeThoughts: trueи уровнем / бюджетом размышления, заданными исходя из effort. - xAI Grok: пробрасывается для семейства grok-3-mini (которое
принимает
reasoning_effortнативно). - DeepSeek reasoner: модель — reasoner по своей природе;
reasoning_effortничего не делает.
2. Суффикс имени модели -{effort}
Можно также запечь effort в имя модели. Распознаваемые суффиксы:
-minimal / -low / -medium / -high / -max.
Семейства моделей рассуждения в этом развёртывании
OpenAI:openai/o1,o1-proopenai/o3,o3-mini,o3-mini-highopenai/o4-mini,o4-mini-highopenai/gpt-5-proи семействоgpt-5.x-pro
anthropic/claude-sonnet-4.6,claude-opus-4.6,claude-opus-4.7и т. д. — в паре сreasoning_effortили суффиксом-{effort}.
google/gemini-2.5-pro,gemini-2.5-flash,gemini-3-pro-previewи т. д. — в паре сreasoning_effortили суффиксом-{effort}.
deepseek/deepseek-reasoner— reasoner по своей природе.
grok/grok-4-fast-reasoning,grok-4-1-fast-reasoninggrok/grok-3-miniв паре сreasoning_effort: lowилиhigh
/v1/models для актуального каталога.
Трасса рассуждения в ответе
Для OpenAI Responses API скрытое рассуждение модели возвращается как элементыreasoning в выводе ответа. Для Anthropic через нативный
/v1/messages размышления приходят как записи content_block типа
thinking. Шлюз также пробрасывает поле reasoning_content в ответах
chat-completion там, где upstream его предоставляет.
Трассу можно отображать для прозрачности или игнорировать в продакшене.
Биллинг
Токены рассуждения учитываются отдельно вcompletion_tokens_details .reasoning_tokens в объекте usage ответа — см.
Operations / Биллинг и использование.