Gemma4开源MTP投机解码：最高3倍提速零损耗

13小时前 • 币资讯

Gemma4开源MTP投机解码：最高3倍提速零损耗

据 [动察 Beating](https://t.me/OneMillion_AI) 监测，谷歌已发布并开源 **Gemma 4 系列多 Token 预测（MTP）草稿模型**。

—

## 这是什么：轻量级草稿 + 投机解码加速

该模型采用 **投机解码（speculative decoding）** 架构：在保证**主模型最终验证权**不变的前提下，通过一个轻量级辅助模型提前预测多个后续 token，从而实现**最高 3 倍推理提速**，同时**不损耗输出质量与逻辑推理能力**。

—

## 为什么更快：一次预测多个 token，再并行验证

传统大语言模型通常是**一次生成一个 token**，很容易受限于显存带宽，导致算力出现闲置。

而 MTP 方案让草稿模型把利用“闲置算力”变成优势：
– 轻量级草稿模型**提前预测一段未来 token**
– 随后由 **31B 等重型目标模型**并行进行验证
– **若目标模型接受草稿**，就会**一次性接收整段序列**，避免逐 token 反复计算

—

## 进一步提效：共享激活与 KV 缓存 + 端侧聚类优化

为了减少重复计算，团队做了两点关键优化：
– **共享目标模型的激活状态与 KV 缓存**
– KV 缓存用于存储历史上下文，避免重复计算
– 针对端侧 **E2B 与 E4B** 模型，在**嵌入层引入聚类技术**
– 以更省资源的方式提升端侧运行效率

—

## 开源与兼容：Apache 2.0 + 原生支持多推理框架

目前，MTP 模型已采用与 **Gemma 4** 相同的 **Apache 2.0** 协议全面开源，并且**原生支持 vLLM、SGLang 和 Ollama** 等主流推理框架。

—

## 带来的直接价值：降低部署门槛，端侧更友好

这次提速优化让应用落地门槛显著下降：
– 开发者可在**普通消费级显卡**上流畅运行 **26B MoE** 与 **31B 稠密**模型
– 在**移动设备**上以更低功耗支持实时 AI 交互

—

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/178201/

赞 (0)

0

Toly：Solana重大升级Alpenglow或下季度上线

上一篇 13小时前

2026-05-06 01:29:11 比特币81000附近开多：止损80500

下一篇 13小时前

币资讯

比特币ETF单日净流出近6亿美元

【市场动态 | 比特币ETF单日资金流出近6亿美元，市场情绪引关注】据Farside Investors最新监测数据显示，美国比特币现货ETF昨日出现显著资金外流，单日净流出额高…

2025年12月27日
0
美军数千士兵奔赴中东

美军大规模增兵中东：航母打击群与空降师同步部署据美国官方消息，一场大规模的军事调动正在展开。数千名美军增派士兵正前往中东地区，引发国际社会高度关注。两名美国官员证实，「布什」号…

币资讯 2026年4月1日
0
币资讯

本周超140亿美元比特币期权到期

2025年6月25日
0
币资讯

1.33亿TON匿名转移流入链上

🔥 **重磅！1.33 亿枚 TON（约 2.14 亿美元）从匿名地址转移，终入 TON 网络** 📡 **23btc快讯**——据 Arkham 最新数据显示，价值高达 **2….

2025年11月29日
0
比特币价格下跌，突破了每个比特币63500美元的关口。

【2024-04-20 07:03】据23btc报道，最新行情数据显示，比特币（BTC）价格跌破了63500美元关口，现报63449.99美元，日内涨幅收窄至0.05%。行情波动较…

币资讯 2024年4月20日
0
币资讯

黄仁勋赞川普能源政策拯救AI业

【重磅独家】英伟达掌门人黄仁勋发声：人工智能产业的”救世主”，竟是特朗普时期的能源战略？　　在全球科技界掀起新一轮AI浪潮的当下，英伟达CEO黄仁勋日前曝…

2025年12月4日
0
币资讯

马斯克称比特币或成储备货币

2025年6月5日
0
OtherSide宣布将于7月27日启动“龙计划”Project Dragon，拥有BAYC和MAYC等资产的持有者可参与。

【2024-07-20 11:45】金色财经讯，Yuga Labs集团力作元宇宙OtherSide即将于7月27日午时，盛大开启“龙之篇章”Project Dragon。Meebi…

币资讯 2024年7月20日
0
美联储3月维持利率不变的概率为99%。

【2024-03-13 06:24】据23btc报道，根据CME公布的“美联储观察”数据显示，美联储预计在3月将维持利率在5.25%-5.50%的区间不变的概率高达99.0%，而下…

币资讯 2024年3月13日
0
币资讯

加密基金高管，因5500万重大计划，被判3年刑期。

【2024-05-21 15:23】金色财经消息，俄罗斯加密基金Finiko前高管Lilian Nurieva，因诈骗与涉黑，被判三年有期徒刑。这场5500万美元的加密金字塔骗局，…

2024年5月21日
0