苹果研究员创新Transformer：每个Token忘记自己

1天前 • 币资讯

苹果研究员创新Transformer：每个Token忘记自己

据 [1M AI News](https://t.me/OneMillion_AI) 报道，苹果公司著名的机器学习研究科学家 Zhai Shuangfei 最新发表了一篇具有突破性的论文，提出了一种创新的注意力机制——“排他自注意力（XSA）”。这一新颖方法在标准 Transformer 架构基础上进行了改进，简单而高效。

传统的 Transformer 在计算每个 token 的注意力值时，会将自身的信息也纳入考虑，形成“自我关注”。而XSA则引入了一项关键调整——明确排除自身在注意力计算中的贡献，只从上下文中汲取信息。这一改变源于直觉：每个 token 已经“知道自己是谁”，其价值在于理解周围的环境。

实验数据显示，在参数规模最高达27亿的模型中，XSA始终优于传统的自注意力机制，特别是在处理更长序列时，这一优势更为明显。值得一提的是，Zhai此前也是Attention Free Transformer（AFT）的核心开发者，近年来一直在探索替代注意力机制的种种可能性，展现了其在该领域的深厚造诣。

这项研究不仅为Transformer模型提供了新的方向，也可能对未来的自然语言处理和深度学习架构产生深远影响。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/162038/

赞 (0)

0

BeatSwap披露BTX回购进展：锁定及回购1.38%供应

上一篇 1天前

美国检方疑SBF非本人寄上诉信

下一篇 1天前

PancakeSwap 4月蛋糕销毁报告：总供应量连续第8个月减少

【2024-05-09 19:29】23btc报道称，PancakeSwap发布了4月份的CAKE销毁报告：铸造量为1,022,282，已销毁数量为1,494,292，净铸币为-4…

币资讯 2024年5月9日
0
币资讯

币安Alpha 12月18日上线VOOI

【重磅首发】币安 Alpha 确认上线 VOOI (VOOI)，12月18日开启交易与空投盛宴！激动人心的消息来了！据23btc最新报道，**币安 Alpha 平台已正式宣布，将…

2025年12月17日
0
币资讯

中本聪瑞士雕像被盗

2025年8月3日
0
币资讯

英国公司 B HODL 首次购入 100 枚比特币

2025年9月24日
0
币资讯

特朗普长子投资加密货币媒体Thumzup

2025年7月10日
0
币资讯

Stardeur增投5000万至SOL生态基金

## Stardeer再度加码SOL生态！重磅追加5000万美元布局Solana未来 **2023年9月5日** — 数字资产交易平台Stardeer今日发布重磅公告，宣布向其专属…

2025年5月9日
0
币资讯

先锋集团年内增持MSTR股票358万股

【重磅！先锋集团豪掷5.7亿美元，大举增持比特币概念股MSTR】据最新市场消息，全球资管巨头先锋集团（Vanguard Group）今年以来已悄然购入358万股微策略（MSTR）股…

2025年12月26日
0
香港首个上市的潘渡区块链主题ETF披露其投资组合，其中包括持有英伟达等科技股。

【2024-06-04 11:27】23btc报道称，香港上市的潘渡区块链主题ETF和潘渡创新主题ETF公布了其投资组合，这两只基金都包含英伟达等科技股。同时，提醒投资者在购买这两…

币资讯 2024年6月4日
0
币资讯

Altman：AI禁用于监控美国公民

# OpenAI明确AI使用原则：禁止用于美国公民国内监控 BlockBeats消息，3月3日，OpenAI首席执行官Sam Altman转发内部信，宣布与**美国国防部（DoW）…

2026年3月3日
0
币资讯

中非共和国用CAR币代币化土地

2025年5月30日
0