Blackwell登顶智能体基准,能效超H200二十倍

Blackwell登顶智能体基准,能效超H200二十倍
核心摘要

评测机构 Artificial Analysis 发布了行业首个智能体硬件基准 AA-AgentPerf,旨在衡量硬件在真实编程场景中支持并发智能体的能效表现。首期测试基于 1.6 万亿参数的开源模型 DeepSeek V4 Pro,结果显示英伟达 Blackwell 液冷整柜系统 GB300 NVL72 以极大优势领先。

正文解读

传统评测如同单次问答的短跑,只关注响应速度,而智能体任务更像接力跑,AI 需要自主拆解目标,在读写文件、改写代码和运行测试中反复流转。这种高频交互对服务器内存容量和调度效率提出了极高挑战。新基准通过重放真实编程轨迹,以“每兆瓦功耗支持并发智能体规模”为核心指标,直击数据中心电力与资金瓶颈。

在同等电力预算下,GB300 NVL72 每兆瓦功耗可承载 6.14 万个并发智能体,而上一代 Hopper HGX H200 仅能支持 2600 个,能效提升超过 20 倍。单显卡并发容量也提升了 41 倍。这意味着数据中心可多承载 20 倍智能体并发规模,大幅拉低自动编程和客服等应用的落地成本。

首批成绩中,AMD Instinct MI355X 暂时落后。评测机构指出,AMD 与 H200 均使用通用开源 vLLM 框架搭建,未作深度优化,随着服务框架与内核算子适配跟进,AMD 性能仍有提升空间。目前,Together AI 等推理服务商已率先在 Blackwell 上部署 DeepSeek V4 Pro,为智能体编程工具 Cursor 提供实时推理支持。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/189640/

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐