DPN-LE技术:直接编辑大模型“人格神经元”实现AI精细控

DPN-LE技术:直接编辑大模型“人格神经元”实现AI精细控

BlockBeats 消息|5 月 3 日

AI 研究者 **Brian Roemmele** 披露,其团队打造的「**零人类公司(Zero-Human Company)**」已开始部署一项名为 **DPN-LE(Dual Personality Neuron Localization and Editing)** 的大模型人格编辑技术,用于对 **AI Agent** 的行为特征进行精确调整。

## DPN-LE:定位“人格神经元”,外科手术式改造性格

据介绍,DPN-LE 的核心思路在于:通过定位大模型 **MLP 层**中的「**人格神经元**」,对以下特征进行**定向增强或削弱**:

– 诚实度
– 创造力
– 谨慎性
– 协作性

研究称,该方法只需编辑约 **0.5% 神经元**,即可在**不重新训练模型**的情况下,实现对 AI 性格的「外科手术式」改造;同时尽量避免对核心推理能力造成损伤。

## 100+ Agent 的“人格一致性”需求被放大

Roemmele 表示,其公司目前由 **100 个以上 AI Agent** 构成,企业日常运营几乎实现全自动化,因此「**人格一致性**」成为关键问题。

为此,不同类型的 Agent 会被分配不同的性格参数强化方向,例如:

– **战略类 Agent**:强化「长期一致性」与「分析诚实性」
– **财务与风控 Agent**:强化「谨慎」与「精确」
– **内容类 Agent**:提高「共情能力」与「创造力」
– **多 Agent 协作层**:增强「合作性」

## 更低成本的批量“重塑人格”,对齐成本有望下降

其称,DPN-LE 属于**推理阶段的轻量级修改**,因此公司可在**数分钟内**批量完成「人格重塑」,并快速部署大量 AI Agent,从而显著降低 AI 对齐(Alignment)成本。

市场解读认为,这类「**人格可编程化**」技术,意味着 AI Agent 的竞争正从单纯的能力对抗,进一步扩展到 **行为控制与组织治理** 层面的竞争。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/177421/

(0)
上一篇 5小时前
下一篇 4小时前

相关推荐