Перейти к основному содержанию
Модели рассуждения тратят дополнительные вычисления на скрытый проход «размышления» перед получением финального ответа. Они медленнее и дороже, но решают более сложные задачи. OrcaRouter предоставляет единый синтаксис для управления усилием рассуждения у каждого провайдера — выбирайте ту форму, что подходит вашему клиенту.

Два способа задать effort

1. Поле reasoning_effort (формат OpenAI)

Передавайте его в запросе Chat Completions. Значения: low, medium, high (а также minimal / max на некоторых моделях).
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6",
    messages=[{"role": "user", "content": "Hard math problem..."}],
    reasoning_effort="high",
)
OrcaRouter транслирует это поле в нативный формат upstream:
  • Серия o от OpenAI и семейство gpt-5-pro: пробрасывается как нативный reasoning_effort.
  • Anthropic Claude: отображается в thinking: {type: "enabled", budget_tokens: ...} с бюджетами low→1280, medium→2048, high→4096. Для claude-opus-4.6 конкретно отображается в thinking: {type: "adaptive"} плюс output_config.effort.
  • Google Gemini: отображается в generationConfig.thinkingConfig с includeThoughts: true и уровнем / бюджетом размышления, заданными исходя из effort.
  • xAI Grok: пробрасывается для семейства grok-3-mini (которое принимает reasoning_effort нативно).
  • DeepSeek reasoner: модель — reasoner по своей природе; reasoning_effort ничего не делает.

2. Суффикс имени модели -{effort}

Можно также запечь effort в имя модели. Распознаваемые суффиксы: -minimal / -low / -medium / -high / -max.
# Эквивалентно model="anthropic/claude-opus-4.6" + reasoning_effort="high"
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6-high",
    messages=[...],
)
Работает одинаково у разных провайдеров — выбирайте ту строку, что читается лучше в вашем коде.

Семейства моделей рассуждения в этом развёртывании

OpenAI:
  • openai/o1, o1-pro
  • openai/o3, o3-mini, o3-mini-high
  • openai/o4-mini, o4-mini-high
  • openai/gpt-5-pro и семейство gpt-5.x-pro
Anthropic (расширенное размышление в Claude 4 / Opus):
  • anthropic/claude-sonnet-4.6, claude-opus-4.6, claude-opus-4.7 и т. д. — в паре с reasoning_effort или суффиксом -{effort}.
Google Gemini (расширенное размышление в Gemini 2.5 / 3.x):
  • google/gemini-2.5-pro, gemini-2.5-flash, gemini-3-pro-preview и т. д. — в паре с reasoning_effort или суффиксом -{effort}.
DeepSeek:
  • deepseek/deepseek-reasoner — reasoner по своей природе.
xAI Grok:
  • grok/grok-4-fast-reasoning, grok-4-1-fast-reasoning
  • grok/grok-3-mini в паре с reasoning_effort: low или high
Вызовите /v1/models для актуального каталога.

Трасса рассуждения в ответе

Для OpenAI Responses API скрытое рассуждение модели возвращается как элементы reasoning в выводе ответа. Для Anthropic через нативный /v1/messages размышления приходят как записи content_block типа thinking. Шлюз также пробрасывает поле reasoning_content в ответах chat-completion там, где upstream его предоставляет. Трассу можно отображать для прозрачности или игнорировать в продакшене.

Биллинг

Токены рассуждения учитываются отдельно в completion_tokens_details .reasoning_tokens в объекте usage ответа — см. Operations / Биллинг и использование.