据【动察 Beating】监测,Nous Research 的 Hermes Agent 已正式上线 macOS 电脑控制(Computer Use)功能。
这项能力在体验上直接对标 OpenAI Codex 的「后台控制」。其底层接入了本频道此前报道过的开源驱动 cua-driver,并通过逆向苹果私有 API,向目标进程直接下发操作指令。
换句话说:当 Agent 在后台完成搜邮件、敲代码等任务时,用户的实体鼠标不会乱跳,当前窗口焦点也不会被抢走;实现了在同一台电脑上,人机互不打扰的协同工作。
需要注意的是,电脑控制高度依赖连续截图,因此 Token 账单往往会“蹭蹭上涨”。为此,Hermes 在框架层引入了四重上下文压缩机制:强制剔除冗余画面,仅让模型记忆最近 3 张截图,并配合服务端清理旧缓存。
官方测算显示:在 1568×900 分辨率下连续执行 20 步操作,上下文消耗能从约 60 万 Token 降至约 3 万。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/179683/


