英伟达Cosmos 3物理AI双版开放下载

英伟达Cosmos 3物理AI双版开放下载
核心摘要

英伟达今日正式开放 Cosmos 3 世界模型的模型权重下载,首批发布 Super(646 亿参数)和 Nano(157 亿参数)两个版本,均已上线 HuggingFace(无门控,可直接下载)和 build.nvidia.com,同时支持以 NVIDIA NIM 微服务形式部署。

正文解读

Cosmos 3 定位为面向物理 AI 的全模态(omnimodel)世界基础模型,基于全新的混合 Transformer 架构(Mixture of Transformers),原生理解和生成文本、图像、视频、环境声和动作。Super 版本面向需要最高物理精度的后训练机器人和自动驾驶模型,Nano 版本针对高质量视频和动作推理的低延迟场景。此外,Edge 版本(面向边缘端实时推理)预计近期发布。

英伟达称 Cosmos 3 是“全球首个完全开放的全模态模型”,开发者可自由下载、后训练并转化为专有模型。这一开放策略有望加速机器人、自动驾驶等物理 AI 领域的研发进程,降低中小团队进入世界模型研究的技术门槛。

要点:混合 Transformer 架构在统一多模态理解与生成方面提供了新的技术路径;无门控下载加上 NIM 微服务支持,兼顾了研究灵活性与企业部署需求。

需要留意的是,大规模世界模型的训练与部署对算力要求极高,开发者在实际应用中仍需权衡模型规模与推理成本。Edge 版本的发布节奏也将影响边缘端场景的落地进度。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/184527/

(0)
上一篇 4小时前
下一篇 3小时前

相关推荐