乐天发布AI 3.0,底层架构为DeepSeek V3

乐天发布AI 3.0,底层架构为DeepSeek V3

重磅开源!乐天发布“日本最强”AI大模型,背后竟是中国力量?

1M AI News 监测,日本科技巨头乐天集团今日正式发布名为 Rakuten AI 3.0 的全新大语言模型,并高调宣称其为“日本最大高性能AI模型”。

更引人注目的是,该模型已根据 Apache 2.0 协议 完全免费开源,向全球开发者开放。

🚀 官方宣称的强悍性能

  • 架构: 采用先进的 MoE(混合专家)架构
  • 规模: 总参数量高达 6710亿 参数
  • 效率: 每次推理仅激活 370亿 参数
  • 上下文: 支持长达 128K 的上下文窗口
  • 专长: 针对日语进行了深度优化,官方称其在多项日语基准测试中表现超越 GPT-4o

乐天在公告中指出,该模型是日本经济产业省与新能源产业技术综合开发机构(NEDO)联合推进的 GENIAC 项目 的重要成果,其训练过程获得了日本政府提供的部分算力资助。

对于模型的基础来源,乐天以“充分利用开源社区最优成果”一笔带过,并未提及具体模型名称。


🔍 社区“破案”:内核源自中国DeepSeek

模型发布后,技术社区迅速行动,在 HuggingFace 上发布的模型文件中发现了关键信息。

config.json 配置文件中,明确写入了以下字段:

"model_type": "deepseek_v3",
"architectures": "DeepseekV3ForCausalLM"

此外,其公布的 671B总参数、37B激活参数、128K上下文 等核心规格,与国内深度求索公司开源的 DeepSeek V3 模型完全一致。

这几乎确凿地表明,Rakuten AI 3.0 正是在中国 DeepSeek V3 模型的基础上,使用日语数据进行微调而诞生的“日语特化版”

这一发现引发了业界广泛讨论:日本顶尖的AI项目,其核心竟构建在中国领先的开源模型之上。这既体现了全球开源协作的力量,也展示了中国AI模型在国际舞台上日益增强的影响力与认可度。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/160236/

(0)
上一篇 10小时前
下一篇 10小时前

相关推荐