Hai cách để đặt effort
1. Trường reasoning_effort (định dạng OpenAI)
Truyền nó trong yêu cầu Chat Completions. Các giá trị: low,
medium, high (và minimal / max trên một số mô hình).
- OpenAI dòng o và họ gpt-5-pro: chuyển tiếp dưới dạng
reasoning_effortbản địa. - Anthropic Claude: ánh xạ thành
thinking: {type: "enabled", budget_tokens: ...}với ngân sáchlow→1280,medium→2048,high→4096. Riêng vớiclaude-opus-4.6, ánh xạ thànhthinking: {type: "adaptive"}cộngoutput_config.effort. - Google Gemini: ánh xạ thành
generationConfig.thinkingConfigvớiincludeThoughts: truevà mức/ngân sách thinking đặt từ effort. - xAI Grok: chuyển tiếp cho họ grok-3-mini (vốn chấp nhận
reasoning_effortbản địa). - DeepSeek reasoner: mô hình đã là reasoner theo thiết kế;
reasoning_effortkhông có tác dụng.
2. Hậu tố -{effort} trong tên mô hình
Bạn cũng có thể đặt effort vào tên mô hình. Các hậu tố được nhận
diện: -minimal / -low / -medium / -high / -max.
Các họ mô hình suy luận trong triển khai này
OpenAI:openai/o1,o1-proopenai/o3,o3-mini,o3-mini-highopenai/o4-mini,o4-mini-highopenai/gpt-5-provà họgpt-5.x-pro
anthropic/claude-sonnet-4.6,claude-opus-4.6,claude-opus-4.7, v.v. — kết hợp vớireasoning_efforthoặc hậu tố-{effort}.
google/gemini-2.5-pro,gemini-2.5-flash,gemini-3-pro-preview, v.v. — kết hợp vớireasoning_efforthoặc hậu tố-{effort}.
deepseek/deepseek-reasoner— reasoner theo thiết kế.
grok/grok-4-fast-reasoning,grok-4-1-fast-reasoninggrok/grok-3-minikết hợp vớireasoning_effort: lowhoặchigh
/v1/models để lấy danh mục trực tiếp.
Vết suy luận trong phản hồi
Với OpenAI Responses API, phần suy luận ẩn của mô hình được trả về dưới dạng các mụcreasoning trong output. Với Anthropic qua
/v1/messages bản địa, suy nghĩ đến dưới dạng các mục content_block
loại thinking. Gateway cũng đưa ra trường reasoning_content trên
phản hồi chat-completion nơi upstream cung cấp.
Bạn có thể hiển thị vết để minh bạch hoặc bỏ qua trong môi trường
production.
Tính phí
Token suy luận được theo dõi riêng tạicompletion_tokens_details.reasoning_tokens trong đối tượng usage của
phản hồi — xem
Vận hành / Thanh toán và sử dụng.