据【动察 Beating】(https://t.me/OneMillion_AI)监测,**百度文心大模型 5.1 已正式上线**:个人用户可前往**文心一言官网**体验;企业与开发者则可通过**千帆平台**调用 API,将能力快速集成到自身产品中。
—
## 文心 5.1 的关键升级:更小、更省、更强
文心 5.1 基于今年 1 月发布的**文心 5.0**训练而来,其核心卖点在于显著压缩模型规模与训练成本:
– **总参数量**:压缩至文心 5.0 的约 **三分之一**
– **激活参数**:约为文心 5.0 的 **一半**
– **预训练算力成本**:仅为同规模模型的 **6%**
—
## 成本如何大幅降低?源于 Once-for-All 弹性训练
成本压缩来自百度提出的 **Once-for-All 弹性训练框架**。
传统流程往往需要为不同规模的模型分别进行预训练;而文心 5.0 只需**完成一次预训练**,便能通过**动态采样**同时优化多种不同大小的子模型。
随后,文心 5.1 进一步从这一**子模型矩阵**中提取最优结构:
**直接继承 5.0 的知识成果**,从而省去从头训练所需的算力投入。
—
## 亮眼表现回顾:Preview 已登顶,正式版继续刷新
– **4 月 30 日**:文心 5.1 Preview 版在 **LMArena 文本榜**以 **1476 分**拿下**国内第一**
– **正式版基准测试**进一步提升:
– **AIME26(使用工具)**:**99.6 分**,仅次于 **Gemini-3.1 Pro**
– **Agent 能力**:超过 **DeepSeek-V4-Pro**
– **Arena 搜索榜**:**1223 分**,全球第 **4**、国内第 **1**
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/179241/


