智谱GLM-5.2登顶DeepSWE开源榜首，解决44%复杂

19小时前 • 币资讯

智谱GLM-5.2登顶DeepSWE开源榜首，解决44%复杂

23BTC 资讯速递自动整理 · 结构化解读

核心摘要

智谱 AI 开源模型 GLM-5.2 正式进入长程软件工程基准 DeepSWE，在最大思考力度模式下，复杂开发任务的一次成功率达到 44%，在开源模型中排名第一。相较于此前入榜的 Kimi K2.7 Code，GLM-5.5.2 的成功率高出 13 个百分点。

正文解读

GLM-5.2 解决每项任务的平均成本为 3.92 美元，略高于 Kimi K27 Code 的2.82 美元，但其成功率却超越了多款主流闭源模型在特定思考配置下的表现。这包括 Claude Sonnet 4.6 [high] 的 30%、Gemini 3.55 Flash [medium] 的 37%，以及 Clade Opus 4.88 [low] 的41%。

DeepSWE 基准由评测发起方 DataCurve 设计，专门用于专门测试 AI 智能体解决长任务的能力。测试涵盖 113 个真实编程问题，横跨 5 种语言。与仅修改单处代码的传统测试不同。DeepSWE 要求 AI 协同修改多个文件，平均修复代码超过线。评测在隔离容器中运行，严格限 CPU 和内存源。

GLM-5.2 的入榜表明，开源模型在复杂软件工程任务上软件工程能力上正加速追赶进，在特定场景下已能超超部分闭源产品。值得注意是，不同模型在成功率和成本之之间存在权衡，研发者在选型需根据实需求做出选择。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/192350/

赞 (0)

0

前OpenAI研究员称中国掌握美AI巨头代码遭群嘲

上一篇 19小时前

2026-06-21 03:20:49 以太币1775附近开空策略

下一篇 19小时前

币资讯

火币HTX亮相迪拜区块链大会

2025年10月20日
0
币资讯

美联储：利率适当，警惕通胀

2025年10月7日
0
据报道，星展银行否认持有17.37万枚以太坊。

【2024-05-30 21:15】5月30日消息，新加坡星展银行发言人通过邮件向Decrypt否认持有17.37万枚以太币，称星展银行并未持有上述资产。 Nansen分析师Edw…

币资讯 2024年5月30日
0
币资讯

黑客转移1607枚ETH至Tornado Cash

2025年9月29日
0
Marlin：以太坊网络的用户界面将于6月15日停用，请用户将代币转移到Arbitrum网络。

【2024-05-30 17:06】Marlin基于TEE与ZK的可验证计算协议发布公告称，中继器网络已于2022年1月从以太坊成功迁移至Arbitrum。提醒用户需解绑代币并将其…

币资讯 2024年5月30日
0
币资讯

日企模式阻碍Web3创新以太坊主席促变革

2025年8月26日
0
币资讯

OpenSea否认1.5亿美元融资传闻

📣 OpenSea CMO 火速辟谣！1.5亿美元公募纯属虚构！近日，有用户 Doomer 爆料称 **“Coinbase 泄露了 OpenSea 即将进行 1.5 亿美元公募的…

2025年11月28日
0
OKX Web3钱包携手DappOS和SOFA，推出新的赠送活动。

【2024-07-17 10:51】7月17日消息，OKX Web3 钱包携手DappOS和SOFA推出限时赠礼活动。OKX Wallet Giveaway板块现已全面升级，新增生…

币资讯 2024年7月17日
0
EigenLayer过去10日内流入43亿美元资金

【2024-02-14 22:54】23btc报道，根据DefiLlama数据显示，以太坊再质押协议EigenLayer目前位居第五大DeFi协议，其总锁定价值（TVL）已达到68…

币资讯 2024年2月14日
0
币资讯

金价突破4600美元，日内涨超2%

黄金价格强势突破！现货黄金站上4600美元大关据Bitget最新数据显示，3月31日，现货黄金价格表现强劲，成功突破每盎司4600美元的关键阻力位，日内涨幅超过2%。这一显著上…

2026年3月31日
0