前字节Seed工程师称:字节迭代半年,谷歌或三个月

前字节Seed工程师称:字节迭代半年,谷歌或三个月

据【动察 Beating】(https://t.me/OneMillion_AI)监测,前字节跳动 Seed 团队工程师、现北京大学助理教授张驰在播客《Into Asia》中透露:

## 训练周期差距:半年 vs 三个月
张驰表示,字节跳动完成一轮大模型训练(预训练 + 后训练)约需要**半年**;而谷歌(传闻)只需**三个月**。
他认为,**迭代速度**正是中国公司在追赶过程中面临困难的核心原因之一。

## 团队定位:数学更偏“研究宣传”
张驰在字节约一年,所在为数学团队,偏研究性质。
他自述该组的定位是:「更多是为了宣传」,与负责模型交付的**预训练**与**后训练**团队不同。

## Benchmaxxing 文化:冲分不等于好体验
张驰还谈到 Seed 内部的 benchmaxxing(刷分)文化:
– 团队领导按负责的 benchmark 来评估绩效;
– 所有人都在冲分数;
– 但问题在于:**这不能转化为实际使用中的好体验**。

他进一步指出:纸面上看,中国大公司的模型似乎都能追平美国前沿模型;但实际用起来「不够好」。

## 目标全球顶尖,但未“追上”
Seed 的目标是达到全球顶尖水平。
张驰坦言:「但很遗憾,我不认为我们追上了。」
甚至连「国内第一」这样的目标,最终也并未真正实现。

## 追平 GPT-4o 之后:差距仍在
2024 年底,Seed 自认追平 GPT-4o。随后 DeepSeek 发布,团队意识到差距依然存在。
张驰加入时,全组正紧急转向强化学习。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/174319/

(0)
上一篇 10小时前
下一篇 10小时前

相关推荐