月之暗面发布最强开源思考模型Kimi K2 Thinking,推理能力超越GPT-5
据23btc报道,人工智能领域迎来重大突破——月之暗面正式发布其最强开源思考模型Kimi K2 Thinking。该模型在推理能力上实现了质的飞跃,多项指标超越当前主流先进模型。
🚀 核心突破:自主推理与工具调用
Kimi K2 Thinking 作为一个思考模型,具备以下突出能力:
- 自主推理:能够在使用工具的同时进行逐步推理,解决复杂问题;
- 长序列工具调用:无需人为干预,可执行多达200-300个连续工具调用;
- 连贯推理:在数百个步骤中保持逻辑连贯,应对高难度任务。
🏆 性能表现:多项基准测试领先
在多项权威基准测试中,Kimi K2 Thinking 取得了最先进的表现:
- HLE(人类终极考试):得分44.9%,超越Grok4、GPT-5、Claude 4.5等模型;
- Kimi K2 Thinking Heavy版本:得分进一步提升至51%;
- 在推理、代理搜索、编码、写作和通用能力方面均有显著进步。
💡 应用前景广阔
Kimi K2 Thinking 的开源特性将为AI社区带来更多可能性,推动智能推理技术在复杂问题解决、自动化工具调用等场景的广泛应用。
信息来源:金十数据
原创文章,作者:海博社,如若转载,请注明出处:https://www.23btc.com/107677/
