华为开源920亿参数昇腾模型

华为开源920亿参数昇腾模型
核心摘要

华为正式宣布开源盘古 openPangu-2.0-Flash 模型,该模型即将在 GitCode 的 Ascend Tribe 社区上线。这是华为在 AI 开源领域的又一重要动作,旨在通过昇腾原生训练与推理技术,为业界提供算力开发实践参考。

正文解读

openPangu-2.0-Flash 拥有 920 亿总参数,采用混合专家(MoE)架构,实际仅激活 60 亿参数,同时支持 512K 超长上下文。这种设计在保持较强模型能力的前提下,显著降低了推理成本,使得大模型的部署和应用更具可行性。

根据华为公布的开源规划,Flash 版本首批上线内容包括模型权重、基础推理代码和训推算子。性能更强的 openPangu-2.0-Pro 版本权重及推理代码将于 7 月推出,更多组件将在下半年陆续开源。这一分阶段开源策略,既展示了华为在大模型领域的技术积累,也为开发者社区提供了逐步深入参与的机会。

从行业角度看,华为持续推进 AI 模型开源,有助于降低大模型应用门槛,推动国产 AI 生态发展。随着昇腾算力体系的不断完善,开源模型与底层硬件的协同优化,可能成为华为在 AI 领域构建差异化竞争力的关键路径。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/195759/

(0)
上一篇 7小时前
下一篇 7小时前

相关推荐