
跟风 “ 养马 ” ,大可不必

“ 龙虾 ” 还没养明白,周围的人突然又开始 “ 养马 ” 了。
这匹 “ 马 ” ,叫 Hermes 。
和 OpenClaw 一样, Hermes 也是个开源的 Agent 项目,由 Nous Research 团队于 2 月 25 日推出。因拼写跟那个顶奢品牌一样,所以得中文名 “ 爱马仕 ” 。
与 OpenClaw 不同的是, Hermes 多长了 “ 脑子 ” ,主打自我进化,这也是其迅速走红的主要原因。进入 4 月后, Hermes 整体日均 Token 消耗量从 20 亿激增至 3000 亿,以黑马之姿冲进 OpenRouter 等多个开发者平台的多个榜单前列。
于是在社交媒体和电商平台上, “39.99 元专业安装 ” 的服务和 “ 从入门到精通 ” 的教程开始涌现,教人 “ 养马 ” 的生意迅速成形。
一场熟悉的 “ 新技术 — 新焦虑 — 新生意 ” 的循环,又在上演。
更聪明的 “ 马 ”
从技术层面上来说, Hermes 确实比 OpenClaw 更进了一步。
进步体现在, Hermes 试图重构 Agent 的学习方式。
在 OpenClaw 体系中,所谓学习,本质仍然依赖用户。无论是 Skill (技能)的构建,还是记忆的整理与压缩,都需要人为参与。系统更像一个高度可编排的工具集合,来供人使用。
而 Hermes 的变化,在于把这一整套机制收拢向自己。
奇安信人工智能公司安全专家刘岩对中国新闻周刊表示, Hermes 的核心能力来自其可写运行时( Writable Runtime )架构。与 OpenClaw 的静态调用不同, Hermes 在运行过程中可以自动生成、优化、存储新的技能代码,并通过 “ 技能蒸馏 ” 机制将任务经验沉淀为可复用的技能文件。
“ 这意味着 Agent 不是在执行预设的指令集,而是在自己编写自己的能力。 ” 刘岩总结。
换言之,每完成一次任务, Hermes 会从执行过程总结并保存一个个 Skill ,下次遇到相似的问题时,它可以直接加载这些技能,并在任务中持续完善迭代。且这一切,不依赖人插手。
“ 目前使用下来最大的感受就是,当你发出一个任务之后,就算没有执行完,它也会想尽办法给你执行,并且给你回复。 ” 这是 AI 博主人工大黑的亲身体验。
Hermes 与 OpenClaw 的另一个关键差异,在于记忆机制。
OpenClaw 更接近一种全量记录式架构,记忆策略是被动的。
它会将对话上下文、用户偏好等信息持续存储在数据库中,并在需要时通过向量检索调取。好处是,它让信息完整、可追溯,但用户使用越久,记忆规模越膨胀,不准确、不相干的数据噪声也就越多,调用时的 Token 消耗量也随之飙升,检索精度、响应速度也会受到影响。
Hermes 则走向选择性记忆。
它会在与用户对话过程中高频触发回顾机制,对上下文进行整理,并分析提炼出值得被写入长期记忆的信息。此外,它还引入更复杂的记忆后端,对历史对话进行抽象,以提取用户偏好、行为模式等更高层级的信息。理想情况下,可以大幅提升调用效率。
“ 虽然最开始使用 Hermes 的几次对话,跟 OpenClaw 的 Token 消耗量差不多,但越往后聊,会发现 Hermes 消耗的 Token 反而会少一些。 ” 人工大黑表示。
在深度科技研究院院长张孝荣看来, Hermes 给出的是 Agent 进化的一个方向,即从任务执行向认知规划的范式转变。
“ 这种带记忆的自主智能体方向,是未来所有成熟 Agent 的必经之路。 ” 他判断。
还没那么神
但方向先进,目前也还只是方向先进罢了。
在多位受访者看来, Hermes 还远未到成熟阶段。
一个最直接的信号,是版本号。资深 AI 产品经理刘思行指出,当前, Hermes 的最新版本仍处在 0.1 阶段,这其实说明其仍是一个很初阶的实验性产品。
“ 大家把它吹得太玄乎了,其实相比于 OpenClaw 根本没有质变。 ” 实测后虽然觉得 Hermes 有其优点,但人工大黑还是泼了一盆冷水。
在理想设定中, Hermes 可以通过技能蒸馏不断优化自身能力。但在实际使用中,这一过程高度依赖模型判断。
人工大黑认为,那个被全网吹捧的 “ 自动生成 Skill” 的功能,在实际操作中反而成了个麻烦。 “ 以往用 OpenClaw ,遇到重要任务我会主动提醒它帮我总结。而 Hermes 有些太 ‘ 自作聪明 ’ 了,不管什么事它都会自动生成一堆技能,我的 Skill 会越来越多,且很冗余,有些东西根本没有必要。 ”
“ 不是每个人都能用好 AI 。用不好的人给的反馈没有价值,如果他们直接用 Hermes ,会让这匹马 ‘ 越学越差 ’ 。 ” 刘思行也表示。
同时,这种自进化还可能带来更大的安全隐患。
“Hermes 的风险比传统 Agent 更难防御。最大的不确定性在于,你无法预判 Agent 会从哪些数据中学习,以及它生成的技能是否包含危险指令。 ” 刘岩指出, “ 因为恶意行为不是外部植入的,而是 Agent 从环境中自我演化出来的。攻击者甚至不需要直接攻击 Agent 本身,只需要在 Agent 能接触到的数据中埋下种子,可能是一封恶意邮件、一个含隐藏指令的网页、一份被投毒的文档, Agent 就可能主动从中学习到危险行为。 ”
Hermes 的记忆机制也同样存在问题。
尽管 Hermes 尝试通过抽象和筛选提升效率,但这一过程并非总是有效。在一些复杂任务中,过度抽象反而可能丢失关键细节,而在长期使用后,记忆体系本身也可能出现结构混乱的问题。
换句话说,它试图解决记什么,但还没有稳定解决怎么记得更好。这也是很多用户体验后的感觉, “ 依然会忘事儿 ” 。
除了能力本身, Hermes 的使用门槛尚未明显下降。
刘思行表示,目前, Hermes 仍然依赖服务器部署和环境配置,使用方式更接近早期的 OpenClaw ,对于非技术用户而言,从安装、调试到日常维护,都存在不小难度。
与已经被大厂产品化的各类 Claw 工具相比, Hermes 离开箱即用还有明显距离。
不过更重要的是,许多用户在尝试这类 Agent 时,并没有清晰的使用场景。
张孝荣指出,大多数用户对一款又一款 AI 工具的追逐,更多是由 FOMO (错失恐惧)驱动的 “ 数字囤积 ” 行为,而非完全由需求驱动。 “ 它更像是一种情绪消费,是在追逐一种缓解焦虑的安慰剂。 ”
人工大黑也认为,普通用户最大的误区,在于 “ 先上工具,再想需求 ” 。在没有明确任务目标的情况下, Agent 往往会反复试错,消耗大量 Token ,但产出并不稳定。于是,很多人最后得到的不是效率提升,而是更高的使用成本。
因此,在多位受访者看来,对于普通用户而言, Hermes 还不是一款需要立刻投入时间和成本去深度使用的工具。
“ 如果你连 ‘ 龙虾 ’ 都还没养明白, ‘ 马 ’ 其实可以先放一放。 ” 刘思行说。