“龙虾”过时了，现在流行“养马”？

Source

“龙虾”过时了，现在流行“养马”？

跟风 “ 养马 ” ，大可不必

“ 龙虾 ” 还没养明白，周围的人突然又开始 “ 养马 ” 了。

这匹 “ 马 ” ，叫 Hermes 。

和 OpenClaw 一样， Hermes 也是个开源的 Agent 项目，由 Nous Research 团队于 2 月 25 日推出。因拼写跟那个顶奢品牌一样，所以得中文名 “ 爱马仕 ” 。

与 OpenClaw 不同的是， Hermes 多长了 “ 脑子 ” ，主打自我进化，这也是其迅速走红的主要原因。进入 4 月后， Hermes 整体日均 Token 消耗量从 20 亿激增至 3000 亿，以黑马之姿冲进 OpenRouter 等多个开发者平台的多个榜单前列。

于是在社交媒体和电商平台上， “39.99 元专业安装 ” 的服务和 “ 从入门到精通 ” 的教程开始涌现，教人 “ 养马 ” 的生意迅速成形。

一场熟悉的 “ 新技术 — 新焦虑 — 新生意 ” 的循环，又在上演。

更聪明的 “ 马 ”

从技术层面上来说， Hermes 确实比 OpenClaw 更进了一步。

进步体现在， Hermes 试图重构 Agent 的学习方式。

在 OpenClaw 体系中，所谓学习，本质仍然依赖用户。无论是 Skill （技能）的构建，还是记忆的整理与压缩，都需要人为参与。系统更像一个高度可编排的工具集合，来供人使用。

而 Hermes 的变化，在于把这一整套机制收拢向自己。

奇安信人工智能公司安全专家刘岩对中国新闻周刊表示， Hermes 的核心能力来自其可写运行时（ Writable Runtime ）架构。与 OpenClaw 的静态调用不同， Hermes 在运行过程中可以自动生成、优化、存储新的技能代码，并通过 “ 技能蒸馏 ” 机制将任务经验沉淀为可复用的技能文件。

“ 这意味着 Agent 不是在执行预设的指令集，而是在自己编写自己的能力。 ” 刘岩总结。

换言之，每完成一次任务， Hermes 会从执行过程总结并保存一个个 Skill ，下次遇到相似的问题时，它可以直接加载这些技能，并在任务中持续完善迭代。且这一切，不依赖人插手。

“ 目前使用下来最大的感受就是，当你发出一个任务之后，就算没有执行完，它也会想尽办法给你执行，并且给你回复。 ” 这是 AI 博主人工大黑的亲身体验。

Hermes 与 OpenClaw 的另一个关键差异，在于记忆机制。

OpenClaw 更接近一种全量记录式架构，记忆策略是被动的。

它会将对话上下文、用户偏好等信息持续存储在数据库中，并在需要时通过向量检索调取。好处是，它让信息完整、可追溯，但用户使用越久，记忆规模越膨胀，不准确、不相干的数据噪声也就越多，调用时的 Token 消耗量也随之飙升，检索精度、响应速度也会受到影响。

Hermes 则走向选择性记忆。

它会在与用户对话过程中高频触发回顾机制，对上下文进行整理，并分析提炼出值得被写入长期记忆的信息。此外，它还引入更复杂的记忆后端，对历史对话进行抽象，以提取用户偏好、行为模式等更高层级的信息。理想情况下，可以大幅提升调用效率。

“ 虽然最开始使用 Hermes 的几次对话，跟 OpenClaw 的 Token 消耗量差不多，但越往后聊，会发现 Hermes 消耗的 Token 反而会少一些。 ” 人工大黑表示。

在深度科技研究院院长张孝荣看来， Hermes 给出的是 Agent 进化的一个方向，即从任务执行向认知规划的范式转变。

“ 这种带记忆的自主智能体方向，是未来所有成熟 Agent 的必经之路。 ” 他判断。

还没那么神

但方向先进，目前也还只是方向先进罢了。

在多位受访者看来， Hermes 还远未到成熟阶段。

一个最直接的信号，是版本号。资深 AI 产品经理刘思行指出，当前， Hermes 的最新版本仍处在 0.1 阶段，这其实说明其仍是一个很初阶的实验性产品。

“ 大家把它吹得太玄乎了，其实相比于 OpenClaw 根本没有质变。 ” 实测后虽然觉得 Hermes 有其优点，但人工大黑还是泼了一盆冷水。

在理想设定中， Hermes 可以通过技能蒸馏不断优化自身能力。但在实际使用中，这一过程高度依赖模型判断。

人工大黑认为，那个被全网吹捧的 “ 自动生成 Skill” 的功能，在实际操作中反而成了个麻烦。 “ 以往用 OpenClaw ，遇到重要任务我会主动提醒它帮我总结。而 Hermes 有些太 ‘ 自作聪明 ’ 了，不管什么事它都会自动生成一堆技能，我的 Skill 会越来越多，且很冗余，有些东西根本没有必要。 ”

“ 不是每个人都能用好 AI 。用不好的人给的反馈没有价值，如果他们直接用 Hermes ，会让这匹马 ‘ 越学越差 ’ 。 ” 刘思行也表示。

同时，这种自进化还可能带来更大的安全隐患。

“Hermes 的风险比传统 Agent 更难防御。最大的不确定性在于，你无法预判 Agent 会从哪些数据中学习，以及它生成的技能是否包含危险指令。 ” 刘岩指出， “ 因为恶意行为不是外部植入的，而是 Agent 从环境中自我演化出来的。攻击者甚至不需要直接攻击 Agent 本身，只需要在 Agent 能接触到的数据中埋下种子，可能是一封恶意邮件、一个含隐藏指令的网页、一份被投毒的文档， Agent 就可能主动从中学习到危险行为。 ”

Hermes 的记忆机制也同样存在问题。

尽管 Hermes 尝试通过抽象和筛选提升效率，但这一过程并非总是有效。在一些复杂任务中，过度抽象反而可能丢失关键细节，而在长期使用后，记忆体系本身也可能出现结构混乱的问题。

换句话说，它试图解决记什么，但还没有稳定解决怎么记得更好。这也是很多用户体验后的感觉， “ 依然会忘事儿 ” 。

除了能力本身， Hermes 的使用门槛尚未明显下降。

刘思行表示，目前， Hermes 仍然依赖服务器部署和环境配置，使用方式更接近早期的 OpenClaw ，对于非技术用户而言，从安装、调试到日常维护，都存在不小难度。

与已经被大厂产品化的各类 Claw 工具相比， Hermes 离开箱即用还有明显距离。

不过更重要的是，许多用户在尝试这类 Agent 时，并没有清晰的使用场景。

张孝荣指出，大多数用户对一款又一款 AI 工具的追逐，更多是由 FOMO （错失恐惧）驱动的 “ 数字囤积 ” 行为，而非完全由需求驱动。 “ 它更像是一种情绪消费，是在追逐一种缓解焦虑的安慰剂。 ”

人工大黑也认为，普通用户最大的误区，在于 “ 先上工具，再想需求 ” 。在没有明确任务目标的情况下， Agent 往往会反复试错，消耗大量 Token ，但产出并不稳定。于是，很多人最后得到的不是效率提升，而是更高的使用成本。

因此，在多位受访者看来，对于普通用户而言， Hermes 还不是一款需要立刻投入时间和成本去深度使用的工具。

“ 如果你连 ‘ 龙虾 ’ 都还没养明白， ‘ 马 ’ 其实可以先放一放。 ” 刘思行说。