6 月 1 日,英伟达创始人黄仁勋在 GTC Taipei 2026 演讲中,围绕 Agent 的计算需求重新阐释了 Vera Rubin 平台的设计逻辑。他强调 Vera Rubin 不是一颗芯片或一块 GPU,而是一整套从端到端设计的系统,也是英伟达历史上最具雄心的项目,全公司 4 万名工程师参与打造。
正文解读
黄仁勋以 Agent 的运行机制解释了为何需要这样一套系统。Agent 本质上是聚合与分布式的异构计算模型:大语言模型在 GPU 上思考,每次推理都会激活整排 Grace Blackwell NVLink 72;编排引擎在 CPU 上调度全流程;工具调用同时动用 CPU 和 GPU;安全层运行在 BlueField DPU 上,实现全程加密。记忆系统涵盖 KV 缓存、数据压缩与检索,黄仁勋预言这将彻底革新存储行业。
Vera Rubin 全栈包含 Rubin GPU 与 NVLink 6 互联、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU 安全处理器以及 DOCA 软件栈。黄仁勋同时宣布,所有 CUDA X 库将配备「技能」,让 Agent 像读说明书一样学会调用这些库,未来 Agent 使用 CUDA X 的效率将远超人类。
黄仁勋表示,英伟达已从 GPU 公司进化为系统公司,如今正再次转型:客户不想买计算机,而是要建 AI 工厂。英伟达的生态已扩展到电力供应、冷却系统、电网等工业基础设施,目标是交付完整的全栈系统,让客户直接构建 AI 基础设施。
要点:Vera Rubin 是英伟达首个为 Agent 时代设计的全栈系统;CUDA X 库将内建 Agent 技能,降低 AI 开发门槛;英伟达正在从芯片供应商转型为 AI 工厂基础设施提供商。随着 Agent 应用场景快速扩展,硬件架构与软件生态的协同优化将成为竞争关键,但系统复杂度与资本投入的急剧上升也可能带来供应链与落地节奏上的挑战。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/184497/



