英伟达物理AI推理模型Cosmos-Reason2开源32B

英伟达物理AI推理模型Cosmos-Reason2开源32B

据 [动察 Beating](https://t.me/OneMillion_AI) 监测,英伟达已开放 **Cosmos-Reason2-32B** 模型权重。

## Cosmos Reason 2 是什么?
**Cosmos Reason 2** 是英伟达去年底发布的 **物理 AI 推理视觉语言模型(VLM)**,能够同时处理**图像、视频与文字**。它被用来帮助**机器人**与**自动驾驶系统**理解 **空间、时间**以及**基础物理规律**。

## 版本开放进度
此前,Cosmos Reason 2 仅开放了 **20 亿**与**80 亿**参数两个小版本权重;直到现在,**320 亿参数的旗舰版**才首次公开。

– 底座:**通义千问 Qwen3-VL-32B-Instruct**
– 授权:**NVIDIA Open Model License**(可商用)

## 能做什么?
拿到行车录像,它可以边看边推理,判断**右转是否安全**。
拿到仓库照片,它能对画面中的货物进行定位,输出**每件货物的 2D/3D 坐标**与**边界框**。

## 主要应用方向
1. **分析城市与工业场景**的视频流
2. **批量标注传感器数据**
3. 作为**人形机器人**与**自动驾驶车辆**的“规划大脑”

## 相比上一代的升级点
– 新增 **目标检测**与 **时间戳精确定位**
– **上下文窗口扩展至 256K tokens**

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/176668/

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐