الاستدلال - OrcaRouter

تستهلك نماذج الاستدلال موارد حوسبة إضافية في تمريرة “تفكير” خفية قبل إنتاج الإجابة النهائية. فهي أبطأ وأغلى لكنها تحل مسائل أصعب. يوفر OrcaRouter صيغة موحدة واحدة للتحكم في جهد الاستدلال عبر كل مزوّد — اختر الشكل الذي يناسب عميلك.

طريقتان لضبط الجهد

1. حقل `reasoning_effort` (شكل OpenAI)

مرّره على طلب Chat Completions. القيم: low و medium و high (و minimal / max على بعض النماذج).

resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6",
    messages=[{"role": "user", "content": "Hard math problem..."}],
    reasoning_effort="high",
)

يترجم OrcaRouter هذا الحقل إلى الشكل الأصلي للمصدر الأعلى:

عائلة OpenAI o-series و gpt-5-pro: تُمرَّر كـ reasoning_effort الأصلي.
Anthropic Claude: تُربط بـ thinking: {type: "enabled", budget_tokens: ...} مع ميزانيات low→1280، و medium→2048، و high→4096. أما claude-opus-4.6 تحديداً، فتُربط بـ thinking: {type: "adaptive"} مع output_config.effort.
Google Gemini: تُربط بـ generationConfig.thinkingConfig مع includeThoughts: true ومستوى تفكير / ميزانية مُحدَّد بناءً على الجهد.
xAI Grok: تُمرَّر لعائلة grok-3-mini (التي تقبل reasoning_effort أصلياً).
DeepSeek reasoner: النموذج مصمَّم للاستدلال أصلاً؛ reasoning_effort لا تأثير له.

2. لاحقة اسم النموذج `-{effort}`

يمكنك أيضاً تضمين الجهد في اسم النموذج. اللواحق المتعرَّف عليها: -minimal / -low / -medium / -high / -max.

# Equivalent to model="anthropic/claude-opus-4.6" + reasoning_effort="high"
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6-high",
    messages=[...],
)

تعمل بنفس الطريقة عبر المزوّدين — اختر السطر الأكثر قراءةً في شيفرتك.

عائلات نماذج الاستدلال في هذا النشر

OpenAI:

openai/o1، o1-pro
openai/o3، o3-mini، o3-mini-high
openai/o4-mini، o4-mini-high
عائلة openai/gpt-5-pro و gpt-5.x-pro

Anthropic (التفكير الممتد على Claude 4 / Opus):

anthropic/claude-sonnet-4.6، claude-opus-4.6، claude-opus-4.7، إلخ. — اقترنها مع reasoning_effort أو اللاحقة -{effort}.

Google Gemini (التفكير الممتد على Gemini 2.5 / 3.x):

google/gemini-2.5-pro، gemini-2.5-flash، gemini-3-pro-preview، إلخ. — اقترنها مع reasoning_effort أو اللاحقة -{effort}.

DeepSeek:

deepseek/deepseek-reasoner — مصمَّم للاستدلال أصلاً.

xAI Grok:

grok/grok-4-fast-reasoning، grok-4-1-fast-reasoning
grok/grok-3-mini مقترناً بـ reasoning_effort: low أو high

استدعِ /v1/models للحصول على الفهرس المباشر.

أثر الاستدلال في الاستجابة

بالنسبة لـ OpenAI Responses API، يُعاد الاستدلال الخفي للنموذج كعناصر reasoning في مخرجات الاستجابة. أما عبر Anthropic الأصلية /v1/messages، فيصل التفكير كإدخالات content_block من النوع thinking. تُظهر البوابة أيضاً حقل reasoning_content على استجابات chat-completion حيث يوفّره المصدر الأعلى. يمكنك عرض الأثر بهدف الشفافية أو تجاهله في الإنتاج.

الفوترة

تُتبَع رموز الاستدلال بشكل منفصل في completion_tokens_details .reasoning_tokens ضمن كائن usage في الاستجابة — راجع العمليات / الفوترة والاستخدام.

​طريقتان لضبط الجهد

​1. حقل reasoning_effort (شكل OpenAI)

​2. لاحقة اسم النموذج -{effort}

​عائلات نماذج الاستدلال في هذا النشر

​أثر الاستدلال في الاستجابة

​الفوترة