Token两月十倍：算力提价焦虑

据 [1M AI News](https://t.me/OneMillion_AI) 监测，在 2026 中关村论坛上，月之暗面创始人杨植麟主持了一场聚焦 OpenClaw 与 AI 开源议题的圆桌对话。参与讨论的嘉宾包括：智谱华章 CEO 张鹏、AI 算力基础设施公司无问芯穹联合创始人兼 CEO 夏立雪、小米 MiMo 大模型负责人罗福莉，以及香港大学助理教授黄超。整场讨论横跨模型、算力基础设施与 Agent 应用三大核心层面，信息密度极高。

Token 正在爆发式增长，行业节奏明显加速

夏立雪分享了一组极具冲击力的数据：自今年 1 月底以来，无问芯穹平台上的 token 用量几乎每两周翻一倍，累计已经增长了 10 倍。

她用一个非常形象的比喻来描述这种增长速度：这让人想起 3G 时代手机流量刚刚起飞时的感觉。

这不仅意味着大模型应用正在快速渗透，也说明市场对算力和推理资源的需求，已经进入了一个全新的增长阶段。

Agent 时代，低价不再是唯一竞争逻辑

从模型厂商的视角出发，张鹏解释了智谱 GLM5 Turbo 近期提价背后的原因。

他指出，Agent 模式已经不再是传统的一问一答。如今，模型要完成一个真实任务，所消耗的 token 数量，很可能是回答一个简单问题的 10 倍，甚至 100 倍。因为这背后涉及到更复杂的能力链条，包括：

长程任务规划
持续调试与纠错
多模态信息的整合与处理

张鹏强调，长期依赖低价竞争，并不利于整个行业的健康发展。随着 Agent 任务复杂度不断提升，模型价值的衡量方式，也正在从“单次回答成本”转向“完成任务的综合能力”。

真正的生产力突破，取决于长上下文推理

罗福莉则把焦点放在了 Agent 时代最关键的技术瓶颈之一：长上下文推理的成本与速度。

她认为，只有当模型在百万级、甚至千万级 token 的上下文规模下，依然能够做到足够低成本、足够高速度，真正具备生产力价值的重要任务，才会被放心交给模型执行。

她还透露，模型“自进化”已经不再只是一个概念，而是正在走向现实。尤其是在目标清晰的科学研究任务中，模型已经可以自主连续运行两到三天，而这种能力，已经让团队内部的研究效率提升了接近 10 倍。

与此同时，她也抛出了一个值得全行业思考的问题：

过去一段时间，推理需求已经增长了近 10 倍。那么到了今年，整体 token 需求有没有可能直接冲向 100 倍？

Agent 应用落地，仍有三大瓶颈待解

从应用层面出发，黄超系统拆解了当前 Agent 发展的三大技术难点：

长链路任务中的 planning 能力仍然不足
多 Agent 协作带来明显的 memory 膨胀压力
skill 生态中存在低质量工具与恶意注入风险

他特别指出，现阶段许多框架的记忆管理方式，依然停留在文件系统和 Markdown 格式层面，这种方式已经难以支撑更复杂、更长期的 Agent 任务。未来的记忆系统，必须走向更加清晰、更加可靠的分层设计。

未来 12 个月，四位嘉宾各给出一个关键词

圆桌最后，四位嘉宾分别用一个词概括了自己对未来 12 个月 AI 发展的判断：

黄超：生态
软件将逐步从“面向人类使用”转向“为 Agent 原生设计”。
罗福莉：自进化
她认为，这是“唯一能创造出新东西的地方”。
夏立雪：可持续 token
她期待中国能够成为“世界的 token 工厂”。
张鹏：算力
他直言，当前 10 倍增长的背后，其实还有 100 倍的需求尚未被真正满足。

写在最后

这场圆桌释放出了一个非常清晰的信号：AI 的竞争焦点，正在从“谁的模型更会回答问题”，迅速转向“谁能支撑更复杂的任务、更长的上下文，以及更大规模的 token 消耗”。

模型、算力、Agent、记忆系统、自进化能力，这些看似分散的关键词，正在汇聚成下一阶段 AI 产业演进的主线。

未来 12 个月，真正决定行业格局的，或许不只是模型参数规模，而是谁能率先把这些能力组合成一个可持续运转的完整生态。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/163966/