AI优化框架助Haiku 4.5终端夺冠，林俊旸预判「环境设

# 斯坦福、MIT联手KRAFTON发布Meta-Harness：AI自动优化执行框架，性能提升超10%

**据 [1M AI News](https://t.me/OneMillion_AI) 监测，斯坦福大学、麻省理工学院（MIT）与韩国知名游戏公司KRAFTON的研究团队近日联合发布了一项突破性技术——Meta-Harness。** 这是一套能够**让AI自动优化执行框架（harness）** 的创新方法，彻底改变了传统依赖人工手写框架的模式。

## 什么是Meta-Harness？

**执行框架（harness）** 是包裹模型、驱动智能体（Agent）行动的核心“脚手架”，它涵盖了提示词设计、工具调用和上下文管理等关键环节。与以往需要工程师手动编写和调试不同，**Meta-Harness 让一个编码智能体（Coding Agent）自动完成优化工作。**

该系统通过**读取历次候选框架的代码、执行日志和性能评分**，不断进行自我分析和迭代，从而自动生成更高效、更强大的新一代执行框架。

## 性能表现：大幅领先

在权威的终端操作基准测试 **TerminalBench-2** 上，Meta-Harness 展现出了惊人的效果：

* **在 Claude Haiku 4.5 模型上**，其优化后的框架实现了 **37.6% 的通过率**，成功超越了 Goose（35.5%）和 Claude Code（27.5%），**在所有已报告的 Haiku 4.5 执行框架中排名第一。**
* **在更强大的 Claude Opus 4.6 模型上**，通过率更是达到了 **76.4%**，位列第二。

这些数据强有力地证明：**同一款AI模型，仅仅更换一套由AI优化过的执行框架，性能差距最高可达10个百分点以上。** 这凸显了框架设计对智能体最终表现的巨大影响力。

## 业界反响：方向性的肯定

这一研究成果迅速引发了行业专家的关注。**前通义千问技术负责人林俊旸** 在转发论文作者的帖子时评论道：

> **「模型加执行框架」已超过「只看模型」**，智能体的表现会被框架的设计和质量显著影响。**「我确实认为这是一个正确的方向。」**

林俊旸早在今年3月27日发布的一篇长文（现已删除）中就曾预判：**环境（框架）设计将从附属项目演变为一个真正的创业品类。** Meta-Harness 的实验数据完美印证了这一前瞻性判断。

## 未来展望

Meta-Harness 的出现，标志着AI开发进入了一个新阶段。它不再仅仅追求更庞大的模型参数，而是开始深入优化模型“如何思考与行动”的底层逻辑。**自动化、智能化的框架优化，有望成为释放大模型潜力的下一个关键突破口。**

随着该方向的持续发展，我们或许将迎来一个由AI设计AI、性能迭代效率飞速提升的新时代。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/165008/

AI优化框架助Haiku 4.5终端夺冠，林俊旸预判「环境设

相关推荐