Рассуждение

Модели рассуждения тратят дополнительные вычисления на скрытый проход «размышления» перед получением финального ответа. Они медленнее и дороже, но решают более сложные задачи. OrcaRouter предоставляет единый синтаксис для управления усилием рассуждения у каждого провайдера — выбирайте ту форму, что подходит вашему клиенту.

Два способа задать effort

1. Поле `reasoning_effort` (формат OpenAI)

Передавайте его в запросе Chat Completions. Значения: low, medium, high (а также minimal / max на некоторых моделях).

resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6",
    messages=[{"role": "user", "content": "Hard math problem..."}],
    reasoning_effort="high",
)

OrcaRouter транслирует это поле в нативный формат upstream:

Серия o от OpenAI и семейство gpt-5-pro: пробрасывается как нативный reasoning_effort.
Anthropic Claude: отображается в thinking: {type: "enabled", budget_tokens: ...} с бюджетами low→1280, medium→2048, high→4096. Для claude-opus-4.6 конкретно отображается в thinking: {type: "adaptive"} плюс output_config.effort.
Google Gemini: отображается в generationConfig.thinkingConfig с includeThoughts: true и уровнем / бюджетом размышления, заданными исходя из effort.
xAI Grok: пробрасывается для семейства grok-3-mini (которое принимает reasoning_effort нативно).
DeepSeek reasoner: модель — reasoner по своей природе; reasoning_effort ничего не делает.

2. Суффикс имени модели `-{effort}`

Можно также запечь effort в имя модели. Распознаваемые суффиксы: -minimal / -low / -medium / -high / -max.

# Эквивалентно model="anthropic/claude-opus-4.6" + reasoning_effort="high"
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6-high",
    messages=[...],
)

Работает одинаково у разных провайдеров — выбирайте ту строку, что читается лучше в вашем коде.

Семейства моделей рассуждения в этом развёртывании

OpenAI:

openai/o1, o1-pro
openai/o3, o3-mini, o3-mini-high
openai/o4-mini, o4-mini-high
openai/gpt-5-pro и семейство gpt-5.x-pro

Anthropic (расширенное размышление в Claude 4 / Opus):

anthropic/claude-sonnet-4.6, claude-opus-4.6, claude-opus-4.7 и т. д. — в паре с reasoning_effort или суффиксом -{effort}.

Google Gemini (расширенное размышление в Gemini 2.5 / 3.x):

google/gemini-2.5-pro, gemini-2.5-flash, gemini-3-pro-preview и т. д. — в паре с reasoning_effort или суффиксом -{effort}.

DeepSeek:

deepseek/deepseek-reasoner — reasoner по своей природе.

xAI Grok:

grok/grok-4-fast-reasoning, grok-4-1-fast-reasoning
grok/grok-3-mini в паре с reasoning_effort: low или high

Вызовите /v1/models для актуального каталога.

Трасса рассуждения в ответе

Для OpenAI Responses API скрытое рассуждение модели возвращается как элементы reasoning в выводе ответа. Для Anthropic через нативный /v1/messages размышления приходят как записи content_block типа thinking. Шлюз также пробрасывает поле reasoning_content в ответах chat-completion там, где upstream его предоставляет. Трассу можно отображать для прозрачности или игнорировать в продакшене.

Биллинг

Токены рассуждения учитываются отдельно в completion_tokens_details .reasoning_tokens в объекте usage ответа — см. Operations / Биллинг и использование.

​Два способа задать effort

​1. Поле reasoning_effort (формат OpenAI)

​2. Суффикс имени модели -{effort}

​Семейства моделей рассуждения в этом развёртывании

​Трасса рассуждения в ответе

​Биллинг