今天我们重点关注两则消息。首先,伊朗方面报道厄尔布尔士省西部和锡里克地区传出爆炸声,事件细节目前仍在核实中。
正文解读
与此同时,谷歌正式发布了一款名为 DiffusionGemma 的实验性开源大模型。这款模型的最大亮点是采用了基于扩散原理的全新文本生成方式,摆脱了传统大语言模型逐词顺序生成的限制。它拥有 260 亿总参数量,在混合专家架构下每次推理仅激活 38 亿参数,模型在本地 GPU 推理中实现了最高 4 倍的速度提升。
DiffusionGemma 的工作方式与图像生成类似,先在画布上铺满随机占位符,再通过多轮迭代逐步擦除噪点并锁定最终文本。每次前向传播可以并行生成 256 个 Token,使所有 Token 之间都能进行双向注意力交互。这种机制在代码补全、行内编辑和数学公式生成等需要非线性思考的任务中具有天然优势,但谷歌也坦言,模型目前的整体输出质量仍低于标准版的 Gemma 4。
在硬件适配方面,DiffusionGemma 的表现同样值得注意。单张 NVIDIA H100 显卡即可实现每秒超过 1000 个 Token 的生成速度,消费级的 RTX 5090 显卡也能跑出每秒 700 多个 Token。经过 4-bit 浮点量化后,推理显存占用可以控制在 18GB 以内,大大降低了开发者在本地部署和测试的门槛。目前,模型权重已在 Hugging Face 开源,并获得了 MLX、vLLM、Unsloth 以及 NVIDIA NeMo 等主流开发工具的支持。
要点:扩散式文本生成打破了”逐词打字机”模式,为代码和数学等结构化任务提供新路径;当前输出质量仍弱于同系列标准模型,定位偏实验性;消费级显卡即可流畅运行,开发者社区支持较为完善。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/188530/



