Blackwell登顶智能体基准，能效超H200二十倍

2026年6月13日下午10:33 • 币资讯

23BTC 资讯速递自动整理 · 结构化解读

核心摘要

评测机构 Artificial Analysis 发布了行业首个智能体硬件基准 AA-AgentPerf，旨在衡量硬件在真实编程场景中支持并发智能体的能效表现。首期测试基于 1.6 万亿参数的开源模型 DeepSeek V4 Pro，结果显示英伟达 Blackwell 液冷整柜系统 GB300 NVL72 以极大优势领先。

正文解读

传统评测如同单次问答的短跑，只关注响应速度，而智能体任务更像接力跑，AI 需要自主拆解目标，在读写文件、改写代码和运行测试中反复流转。这种高频交互对服务器内存容量和调度效率提出了极高挑战。新基准通过重放真实编程轨迹，以“每兆瓦功耗支持并发智能体规模”为核心指标，直击数据中心电力与资金瓶颈。

在同等电力预算下，GB300 NVL72 每兆瓦功耗可承载 6.14 万个并发智能体，而上一代 Hopper HGX H200 仅能支持 2600 个，能效提升超过 20 倍。单显卡并发容量也提升了 41 倍。这意味着数据中心可多承载 20 倍智能体并发规模，大幅拉低自动编程和客服等应用的落地成本。

首批成绩中，AMD Instinct MI355X 暂时落后。评测机构指出，AMD 与 H200 均使用通用开源 vLLM 框架搭建，未作深度优化，随着服务框架与内核算子适配跟进，AMD 性能仍有提升空间。目前，Together AI 等推理服务商已率先在 Blackwell 上部署 DeepSeek V4 Pro，为智能体编程工具 Cursor 提供实时推理支持。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/189640/

Blackwell登顶智能体基准，能效超H200二十倍

正文解读

相关推荐