# 斯坦福、MIT联手KRAFTON发布Meta-Harness:AI自动优化执行框架,性能提升超10%
**据 [1M AI News](https://t.me/OneMillion_AI) 监测,斯坦福大学、麻省理工学院(MIT)与韩国知名游戏公司KRAFTON的研究团队近日联合发布了一项突破性技术——Meta-Harness。** 这是一套能够**让AI自动优化执行框架(harness)** 的创新方法,彻底改变了传统依赖人工手写框架的模式。
## 什么是Meta-Harness?
**执行框架(harness)** 是包裹模型、驱动智能体(Agent)行动的核心“脚手架”,它涵盖了提示词设计、工具调用和上下文管理等关键环节。与以往需要工程师手动编写和调试不同,**Meta-Harness 让一个编码智能体(Coding Agent)自动完成优化工作。**
该系统通过**读取历次候选框架的代码、执行日志和性能评分**,不断进行自我分析和迭代,从而自动生成更高效、更强大的新一代执行框架。
## 性能表现:大幅领先
在权威的终端操作基准测试 **TerminalBench-2** 上,Meta-Harness 展现出了惊人的效果:
* **在 Claude Haiku 4.5 模型上**,其优化后的框架实现了 **37.6% 的通过率**,成功超越了 Goose(35.5%)和 Claude Code(27.5%),**在所有已报告的 Haiku 4.5 执行框架中排名第一。**
* **在更强大的 Claude Opus 4.6 模型上**,通过率更是达到了 **76.4%**,位列第二。
这些数据强有力地证明:**同一款AI模型,仅仅更换一套由AI优化过的执行框架,性能差距最高可达10个百分点以上。** 这凸显了框架设计对智能体最终表现的巨大影响力。
## 业界反响:方向性的肯定
这一研究成果迅速引发了行业专家的关注。**前通义千问技术负责人林俊旸** 在转发论文作者的帖子时评论道:
> **「模型加执行框架」已超过「只看模型」**,智能体的表现会被框架的设计和质量显著影响。**「我确实认为这是一个正确的方向。」**
林俊旸早在今年3月27日发布的一篇长文(现已删除)中就曾预判:**环境(框架)设计将从附属项目演变为一个真正的创业品类。** Meta-Harness 的实验数据完美印证了这一前瞻性判断。
## 未来展望
Meta-Harness 的出现,标志着AI开发进入了一个新阶段。它不再仅仅追求更庞大的模型参数,而是开始深入优化模型“如何思考与行动”的底层逻辑。**自动化、智能化的框架优化,有望成为释放大模型潜力的下一个关键突破口。**
随着该方向的持续发展,我们或许将迎来一个由AI设计AI、性能迭代效率飞速提升的新时代。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/165008/


