伊朗两省传出爆炸声

23BTC 资讯速递自动整理 · 结构化解读

核心摘要

今天我们重点关注两则消息。首先，伊朗方面报道厄尔布尔士省西部和锡里克地区传出爆炸声，事件细节目前仍在核实中。

正文解读

与此同时，谷歌正式发布了一款名为 DiffusionGemma 的实验性开源大模型。这款模型的最大亮点是采用了基于扩散原理的全新文本生成方式，摆脱了传统大语言模型逐词顺序生成的限制。它拥有 260 亿总参数量，在混合专家架构下每次推理仅激活 38 亿参数，模型在本地 GPU 推理中实现了最高 4 倍的速度提升。

DiffusionGemma 的工作方式与图像生成类似，先在画布上铺满随机占位符，再通过多轮迭代逐步擦除噪点并锁定最终文本。每次前向传播可以并行生成 256 个 Token，使所有 Token 之间都能进行双向注意力交互。这种机制在代码补全、行内编辑和数学公式生成等需要非线性思考的任务中具有天然优势，但谷歌也坦言，模型目前的整体输出质量仍低于标准版的 Gemma 4。

在硬件适配方面，DiffusionGemma 的表现同样值得注意。单张 NVIDIA H100 显卡即可实现每秒超过 1000 个 Token 的生成速度，消费级的 RTX 5090 显卡也能跑出每秒 700 多个 Token。经过 4-bit 浮点量化后，推理显存占用可以控制在 18GB 以内，大大降低了开发者在本地部署和测试的门槛。目前，模型权重已在 Hugging Face 开源，并获得了 MLX、vLLM、Unsloth 以及 NVIDIA NeMo 等主流开发工具的支持。

要点：扩散式文本生成打破了”逐词打字机”模式，为代码和数学等结构化任务提供新路径；当前输出质量仍弱于同系列标准模型，定位偏实验性；消费级显卡即可流畅运行，开发者社区支持较为完善。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/188530/

伊朗两省传出爆炸声

正文解读

相关推荐