طريقتان لضبط الجهد
1. حقل reasoning_effort (شكل OpenAI)
مرّره على طلب Chat Completions. القيم: low و medium و
high (و minimal / max على بعض النماذج).
- عائلة OpenAI o-series و gpt-5-pro: تُمرَّر كـ
reasoning_effortالأصلي. - Anthropic Claude: تُربط بـ
thinking: {type: "enabled", budget_tokens: ...}مع ميزانياتlow→1280، وmedium→2048، وhigh→4096. أماclaude-opus-4.6تحديداً، فتُربط بـthinking: {type: "adaptive"}معoutput_config.effort. - Google Gemini: تُربط بـ
generationConfig.thinkingConfigمعincludeThoughts: trueومستوى تفكير / ميزانية مُحدَّد بناءً على الجهد. - xAI Grok: تُمرَّر لعائلة grok-3-mini (التي تقبل
reasoning_effortأصلياً). - DeepSeek reasoner: النموذج مصمَّم للاستدلال أصلاً؛
reasoning_effortلا تأثير له.
2. لاحقة اسم النموذج -{effort}
يمكنك أيضاً تضمين الجهد في اسم النموذج. اللواحق المتعرَّف عليها:
-minimal / -low / -medium / -high / -max.
عائلات نماذج الاستدلال في هذا النشر
OpenAI:openai/o1،o1-proopenai/o3،o3-mini،o3-mini-highopenai/o4-mini،o4-mini-high- عائلة
openai/gpt-5-proوgpt-5.x-pro
anthropic/claude-sonnet-4.6،claude-opus-4.6،claude-opus-4.7، إلخ. — اقترنها معreasoning_effortأو اللاحقة-{effort}.
google/gemini-2.5-pro،gemini-2.5-flash،gemini-3-pro-preview، إلخ. — اقترنها معreasoning_effortأو اللاحقة-{effort}.
deepseek/deepseek-reasoner— مصمَّم للاستدلال أصلاً.
grok/grok-4-fast-reasoning،grok-4-1-fast-reasoninggrok/grok-3-miniمقترناً بـreasoning_effort: lowأوhigh
/v1/models للحصول على الفهرس المباشر.
أثر الاستدلال في الاستجابة
بالنسبة لـ OpenAI Responses API، يُعاد الاستدلال الخفي للنموذج كعناصرreasoning في مخرجات الاستجابة. أما عبر Anthropic الأصلية
/v1/messages، فيصل التفكير كإدخالات content_block من النوع
thinking. تُظهر البوابة أيضاً حقل reasoning_content على استجابات
chat-completion حيث يوفّره المصدر الأعلى.
يمكنك عرض الأثر بهدف الشفافية أو تجاهله في الإنتاج.
الفوترة
تُتبَع رموز الاستدلال بشكل منفصل فيcompletion_tokens_details .reasoning_tokens ضمن كائن usage في الاستجابة — راجع
العمليات / الفوترة والاستخدام.