Tinygrad实测GLM5.2在双机Blackwell达1

Tinygrad实测GLM5.2在双机Blackwell达1
核心摘要

GPU 6 月 21 日,GPU 销售商 Tinygrad 发文称,基于可靠消息,GLM 5.2 2 模型在两台联网 Blackwell 架构 tinybox 上可实现每秒 120 个 token 的推理速度的推理性能。相关配置售价为 15 万美元,用户可选双台标准 tinybox 或单台 tinybox Pro。

正文解读

Tinygrad 以此为卖点,主打“一次购买、永不付云费”的私有化部署路线,直接对标按需计费的云端推理服务模型。通过私有化部署,用户可在保障性能的同时避免长期云端费用积。

目前该消息尚未获 GLM 官方证实。官方证实,Tinygrad 也未公布更多技术细节。

要点:推理性能达每秒 120 token,配置售价 15 万美元;主打私有化部署,对标按需计费云服务;消息尚未得到 GLM 官方确认。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/192380/

(0)
上一篇 18小时前
下一篇 18小时前

相关推荐