6 月 19 日,智谱 AI 创始人唐杰在 X 平台发文透露,GLM-5.2 正式开源发布后已在多项国际权威评测与竞技榜单中取得领先成绩。该模型在 Artificial Analysis Intelligence Index 综合评估中获得 51 分,与 Anthropic 的 Claude Opus 4.8 处于同一水平区间;同时在 Code Arena 前端代码生成对抗测试中以 Elo 1595 排名全球第 2,在 DesignArena 设计与代码融合场景中获得 1360 分排名第 1。
正文解读
要点:GLM-5.2 在综合评估、前端代码生成、设计融合三大评测中均跻身全球前列;其综合评分与 Anthropic Claude Opus 4.8 处于同一水平区间。
从整体来看,GLM-5.2 在前端开发、设计生成与软件工程等多个真实场景评测中持续位居全球前列,正在逐步缩小与 OpenAI 及 Anthropic 等前沿模型之间的性能差距。这表明国产大模型在核心技术路线的持续迭代正推动模型能力上限不断提升,中国大模型在全球竞争中的头部玩家正在加速追赶海外顶尖水平。
此前,针对马斯克提出的”中国大模型可能在明年一季度达到 Anthropic 的 Fable 水平”这一观点,智谱 AI 创始人唐杰回应表示”不会耗费那么长时间”,暗示国产大模型有望在更短时间内实现赶超。结合 GLM-5.2 的最新表现,这一表态也获得了更多实际数据支撑。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/191852/



