重磅开源!乐天发布“日本最强”AI大模型,背后竟是中国力量?
据 1M AI News 监测,日本科技巨头乐天集团今日正式发布名为 Rakuten AI 3.0 的全新大语言模型,并高调宣称其为“日本最大高性能AI模型”。
更引人注目的是,该模型已根据 Apache 2.0 协议 完全免费开源,向全球开发者开放。
🚀 官方宣称的强悍性能
- 架构: 采用先进的 MoE(混合专家)架构
- 规模: 总参数量高达 6710亿 参数
- 效率: 每次推理仅激活 370亿 参数
- 上下文: 支持长达 128K 的上下文窗口
- 专长: 针对日语进行了深度优化,官方称其在多项日语基准测试中表现超越 GPT-4o
乐天在公告中指出,该模型是日本经济产业省与新能源产业技术综合开发机构(NEDO)联合推进的 GENIAC 项目 的重要成果,其训练过程获得了日本政府提供的部分算力资助。
对于模型的基础来源,乐天以“充分利用开源社区最优成果”一笔带过,并未提及具体模型名称。
🔍 社区“破案”:内核源自中国DeepSeek
模型发布后,技术社区迅速行动,在 HuggingFace 上发布的模型文件中发现了关键信息。
在 config.json 配置文件中,明确写入了以下字段:
"model_type": "deepseek_v3",
"architectures": "DeepseekV3ForCausalLM"
此外,其公布的 671B总参数、37B激活参数、128K上下文 等核心规格,与国内深度求索公司开源的 DeepSeek V3 模型完全一致。
这几乎确凿地表明,Rakuten AI 3.0 正是在中国 DeepSeek V3 模型的基础上,使用日语数据进行微调而诞生的“日语特化版”。
这一发现引发了业界广泛讨论:日本顶尖的AI项目,其核心竟构建在中国领先的开源模型之上。这既体现了全球开源协作的力量,也展示了中国AI模型在国际舞台上日益增强的影响力与认可度。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/160236/


