据 [1M AI News](https://t.me/OneMillion_AI) 监测,在 2026 中关村论坛上,月之暗面创始人杨植麟主持了一场聚焦 OpenClaw 与 AI 开源议题的圆桌对话。参与讨论的嘉宾包括:智谱华章 CEO 张鹏、AI 算力基础设施公司无问芯穹联合创始人兼 CEO 夏立雪、小米 MiMo 大模型负责人罗福莉,以及香港大学助理教授黄超。整场讨论横跨模型、算力基础设施与 Agent 应用三大核心层面,信息密度极高。
Token 正在爆发式增长,行业节奏明显加速
夏立雪分享了一组极具冲击力的数据:自今年 1 月底以来,无问芯穹平台上的 token 用量几乎每两周翻一倍,累计已经增长了 10 倍。
她用一个非常形象的比喻来描述这种增长速度:这让人想起 3G 时代手机流量刚刚起飞时的感觉。
这不仅意味着大模型应用正在快速渗透,也说明市场对算力和推理资源的需求,已经进入了一个全新的增长阶段。
Agent 时代,低价不再是唯一竞争逻辑
从模型厂商的视角出发,张鹏解释了智谱 GLM5 Turbo 近期提价背后的原因。
他指出,Agent 模式已经不再是传统的一问一答。如今,模型要完成一个真实任务,所消耗的 token 数量,很可能是回答一个简单问题的 10 倍,甚至 100 倍。因为这背后涉及到更复杂的能力链条,包括:
- 长程任务规划
- 持续调试与纠错
- 多模态信息的整合与处理
张鹏强调,长期依赖低价竞争,并不利于整个行业的健康发展。随着 Agent 任务复杂度不断提升,模型价值的衡量方式,也正在从“单次回答成本”转向“完成任务的综合能力”。
真正的生产力突破,取决于长上下文推理
罗福莉则把焦点放在了 Agent 时代最关键的技术瓶颈之一:长上下文推理的成本与速度。
她认为,只有当模型在百万级、甚至千万级 token 的上下文规模下,依然能够做到足够低成本、足够高速度,真正具备生产力价值的重要任务,才会被放心交给模型执行。
她还透露,模型“自进化”已经不再只是一个概念,而是正在走向现实。尤其是在目标清晰的科学研究任务中,模型已经可以自主连续运行两到三天,而这种能力,已经让团队内部的研究效率提升了接近 10 倍。
与此同时,她也抛出了一个值得全行业思考的问题:
过去一段时间,推理需求已经增长了近 10 倍。那么到了今年,整体 token 需求有没有可能直接冲向 100 倍?
Agent 应用落地,仍有三大瓶颈待解
从应用层面出发,黄超系统拆解了当前 Agent 发展的三大技术难点:
- 长链路任务中的 planning 能力仍然不足
- 多 Agent 协作带来明显的 memory 膨胀压力
- skill 生态中存在低质量工具与恶意注入风险
他特别指出,现阶段许多框架的记忆管理方式,依然停留在文件系统和 Markdown 格式层面,这种方式已经难以支撑更复杂、更长期的 Agent 任务。未来的记忆系统,必须走向更加清晰、更加可靠的分层设计。
未来 12 个月,四位嘉宾各给出一个关键词
圆桌最后,四位嘉宾分别用一个词概括了自己对未来 12 个月 AI 发展的判断:
- 黄超:生态
软件将逐步从“面向人类使用”转向“为 Agent 原生设计”。 - 罗福莉:自进化
她认为,这是“唯一能创造出新东西的地方”。 - 夏立雪:可持续 token
她期待中国能够成为“世界的 token 工厂”。 - 张鹏:算力
他直言,当前 10 倍增长的背后,其实还有 100 倍的需求尚未被真正满足。
写在最后
这场圆桌释放出了一个非常清晰的信号:AI 的竞争焦点,正在从“谁的模型更会回答问题”,迅速转向“谁能支撑更复杂的任务、更长的上下文,以及更大规模的 token 消耗”。
模型、算力、Agent、记忆系统、自进化能力,这些看似分散的关键词,正在汇聚成下一阶段 AI 产业演进的主线。
未来 12 个月,真正决定行业格局的,或许不只是模型参数规模,而是谁能率先把这些能力组合成一个可持续运转的完整生态。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/163966/


