الانتقال إلى المحتوى الرئيسي
تستهلك نماذج الاستدلال موارد حوسبة إضافية في تمريرة “تفكير” خفية قبل إنتاج الإجابة النهائية. فهي أبطأ وأغلى لكنها تحل مسائل أصعب. يوفر OrcaRouter صيغة موحدة واحدة للتحكم في جهد الاستدلال عبر كل مزوّد — اختر الشكل الذي يناسب عميلك.

طريقتان لضبط الجهد

1. حقل reasoning_effort (شكل OpenAI)

مرّره على طلب Chat Completions. القيم: low و medium و highminimal / max على بعض النماذج).
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6",
    messages=[{"role": "user", "content": "Hard math problem..."}],
    reasoning_effort="high",
)
يترجم OrcaRouter هذا الحقل إلى الشكل الأصلي للمصدر الأعلى:
  • عائلة OpenAI o-series و gpt-5-pro: تُمرَّر كـ reasoning_effort الأصلي.
  • Anthropic Claude: تُربط بـ thinking: {type: "enabled", budget_tokens: ...} مع ميزانيات low→1280، و medium→2048، و high→4096. أما claude-opus-4.6 تحديداً، فتُربط بـ thinking: {type: "adaptive"} مع output_config.effort.
  • Google Gemini: تُربط بـ generationConfig.thinkingConfig مع includeThoughts: true ومستوى تفكير / ميزانية مُحدَّد بناءً على الجهد.
  • xAI Grok: تُمرَّر لعائلة grok-3-mini (التي تقبل reasoning_effort أصلياً).
  • DeepSeek reasoner: النموذج مصمَّم للاستدلال أصلاً؛ reasoning_effort لا تأثير له.

2. لاحقة اسم النموذج -{effort}

يمكنك أيضاً تضمين الجهد في اسم النموذج. اللواحق المتعرَّف عليها: -minimal / -low / -medium / -high / -max.
# Equivalent to model="anthropic/claude-opus-4.6" + reasoning_effort="high"
resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.6-high",
    messages=[...],
)
تعمل بنفس الطريقة عبر المزوّدين — اختر السطر الأكثر قراءةً في شيفرتك.

عائلات نماذج الاستدلال في هذا النشر

OpenAI:
  • openai/o1، o1-pro
  • openai/o3، o3-mini، o3-mini-high
  • openai/o4-mini، o4-mini-high
  • عائلة openai/gpt-5-pro و gpt-5.x-pro
Anthropic (التفكير الممتد على Claude 4 / Opus):
  • anthropic/claude-sonnet-4.6، claude-opus-4.6، claude-opus-4.7، إلخ. — اقترنها مع reasoning_effort أو اللاحقة -{effort}.
Google Gemini (التفكير الممتد على Gemini 2.5 / 3.x):
  • google/gemini-2.5-pro، gemini-2.5-flash، gemini-3-pro-preview، إلخ. — اقترنها مع reasoning_effort أو اللاحقة -{effort}.
DeepSeek:
  • deepseek/deepseek-reasoner — مصمَّم للاستدلال أصلاً.
xAI Grok:
  • grok/grok-4-fast-reasoning، grok-4-1-fast-reasoning
  • grok/grok-3-mini مقترناً بـ reasoning_effort: low أو high
استدعِ /v1/models للحصول على الفهرس المباشر.

أثر الاستدلال في الاستجابة

بالنسبة لـ OpenAI Responses API، يُعاد الاستدلال الخفي للنموذج كعناصر reasoning في مخرجات الاستجابة. أما عبر Anthropic الأصلية /v1/messages، فيصل التفكير كإدخالات content_block من النوع thinking. تُظهر البوابة أيضاً حقل reasoning_content على استجابات chat-completion حيث يوفّره المصدر الأعلى. يمكنك عرض الأثر بهدف الشفافية أو تجاهله في الإنتاج.

الفوترة

تُتبَع رموز الاستدلال بشكل منفصل في completion_tokens_details .reasoning_tokens ضمن كائن usage في الاستجابة — راجع العمليات / الفوترة والاستخدام.