还没来得及学OpenClaw,来了个更猛的:Hermes Agent

0 评论 450 浏览 2 收藏 26 分钟

AI Agent领域再迎重磅选手,Hermes Agent以开源姿态两个月斩获50k+ stars,其自进化机制彻底颠覆传统AI助手逻辑。从OpenClaw的技能手动安装到Hermes的自主技能生成,这场AI自治革命正在改写人机协作规则。本文将深度剖析其四层架构与双轨进化体系,揭示从‘人驾驭AI’到‘AI驾驭自己’的技术跃迁。

还没来得及玩 OpenClaw 的可以直接跳过了,现在来了一个更猛的 AI Agent:Hermes Agent。

所以真的是:只要你学得够慢,就不用学了。

前两天刷 B 站的时候,看到一个视频标题带 Hermes 这个词,我第一反应是:这不是 Harness Engineering 吗?谁打错字了?

因为就在前段时间我刚写过那篇 Harness Engineering 的文章,讲的是怎么给 AI Agent 搭工作环境、怎么驾驭 AI 干活。两个词长得实在太像了,Harness,Hermes。

点进去一看,不是打错字。

是 Nous Research 搞的一个全新的开源项目,GitHub 上两个月冲到 50k+ stars。什么概念?OpenClaw 从去年 11 月开源到现在,虽然 stars 已经飙到了 350k+,但人家好歹用了小半年。Hermes 这个速度,说实话感觉更刺激。

说到 OpenClaw,我之前专门写过一篇文章分析过它。结论就两个字:能打,但也真贵。

它的 Token 消耗是海量级的,有用户一晚上跑了 570 万 token,账单直接爆了。而且想让它在你的特定场景上好用,你得拿 SFT 数据去微调,这个门槛比大多数人想象的高太多。

如果说OpenClaw 展示了一个激动人心的未来,那通往那个未来的路上有两座大山:钱和时间。

所以当我看到 Hermes Agent 的时候,我最关心的不是它又多了什么功能,而是:它有没有绕过这两座山?

但真正让我觉得有意思的不是这个问题本身,是这两个词背后的趋势。

Harness Engineering 讲的是人怎么驾驭 AI。Hermes Agent 讲的是 AI 怎么驾驭自己。

你看这条线:Claude Code 是个终端编程工具,你得坐在电脑前盯着它干活;OpenClaw 往前走了一步,你可以用手机远程指挥它,但你还是得手动给它装 Skill、喂数据、培养它;而 Hermes 又往前走了一步,它干完活之后,会自己把这套流程保存成 Skill,下次直接复用。

从你教它干活,到它自己学会干活。

我也是边写边装,安装截图一并放进来,你可以跟着上手。

Hermes Agent 是什么

先说清楚它不是什么。

它不是一个套壳聊天机器人,不是一个 IDE 里的代码补全插件,也不是 OpenClaw 换了个名字。

Hermes Agent 是 Nous Research 做的一个开源 AI 智能体运行时。它是一个可以 7×24 小时跑在你电脑或者服务器上的 AI 助手,有记忆、有技能、有多个聊天入口,而且会自我进化。

这个项目 2026 年 2 月开源,到 4 月 8 号发布 v0.8.0 的时候已经 51.8k stars,6.7k forks。增速确实猛。

做这个项目的 Nous Research 你可能没听过,但在开源 AI 社区里挺有名的。他们之前做过一系列 Hermes 微调模型,在 HuggingFace 上排名一直靠前。这次做 Hermes Agent,算是从模型层往上走了一步,直接做了一个完整的 Agent 框架。

和 OpenClaw 到底有什么区别

很多人第一反应都是:这不就是另一个 OpenClaw 吗?

功能层面确实有重叠。两个项目都支持多平台接入(Telegram、Discord、Slack、微信等),都能调用各种大模型,都有本地执行能力。甚至 Hermes 还内置了 OpenClaw 的迁移工具,一行命令hermes claw migrate就能把你在 OpenClaw 里的配置、记忆、技能、API key 全部导过来。

但核心差异在一个词:自进化。

OpenClaw 的 Skill 体系是个手动生态。你去 ClawHub 上找别人写好的 Skill,下载安装,然后用。用着用着发现不好使,你得自己改,或者拿 SFT 数据去微调。

我之前写 OpenClaw 那篇文章就提过,这个培养过程的时间成本和经济成本都很高,普通用户根本玩不转。

Hermes 的做法不一样。它有一个内置的学习闭环:

执行任务 → 遇到问题自主修正 → 任务完成后主动把流程保存为 Skill → 下次类似任务直接调用 → Skill 在使用中持续改进。

这不是一个可选功能,是默认行为。你不需要配置什么自动学习开关,它就是这么设计的。

所以你看,同样是 Skill 体系,OpenClaw 是被动扩展,你得手动装、手动教;Hermes 是主动成长,它自己学、自己存、自己迭代。

这个区别不是功能多少的问题,是本质上就不一样。

打个比方:OpenClaw 像一个你得手把手教的实习生,你教他做报表,下次换个格式他又不会了。Hermes 像一个会自己写工作笔记的新同事,你教一遍他记一遍,下次同样的活不用你再说了,而且他的笔记会越写越精。

而且 Nous Research 还单独出了一个配套项目叫hermes-agent-self-evolution,用 DSPy + GEPA来做离线自我优化。它会读取 Agent 的执行 trace,分析哪里失败了、为什么失败,然后生成改进方案,跑评估,最好的方案直接提 PR。

所以 Hermes 实际上有两层进化:运行时学习(在线)+ 进化优化(离线)。这个架构野心不小。

四层架构

Hermes 的系统结构分四层,理解了这个架构你就知道它在干什么:

入口层:CLI 命令行 + Gateway 多平台网关。你可以在终端里跟它聊,也可以在 Telegram、微信、飞书、Discord、WhatsApp、钉钉上跟它对话,上下文是同步的。这意味着你在电脑前开始一个任务,出门之后在手机上继续跟它聊,它知道你之前做到哪了。

Agent 层:大脑。负责调用大模型做思考和决策,管理 prompt 和工具调度。支持 Nous Portal、OpenRouter、智谱 AI、KIMI、MiniMax、OpenAI 等,用hermes model一键切换,不锁定任何厂商。这点比 OpenClaw 早期强制绑定特定模型要灵活很多。而且它支持fallback 链,主模型挂了自动切备用,不会中断任务。

执行层:手和脚。内置 28 个工具,能操作文件、跑代码、控制浏览器、对接 MCP 服务。有 6 种代码执行后端(本地、Docker、SSH、Daytona、Singularity、Modal),支持安全隔离。也就是说它跑代码的时候可以在沙箱里跑,不会把你的系统搞崩。这个对于让 Agent 自主执行任务来说非常重要,因为你不可能让一个 AI 随便在你的生产环境里乱搞。

持久层:记忆。这一层是 Hermes 区别于其他 Agent 的核心,所有的“成长”都发生在这里。它有四个组件:

  • Session:会话记录,支持跨平台同步
  • Memory:长期记忆,用 SQLite FTS5 做全文搜索,加上 LLM 摘要做跨会话回忆
  • Skill:技能文档,遵循 agentskills.io 开放标准,跨 Agent 兼容
  • Profile:用户画像,集成了 Honcho 辩证用户建模,它会持续理解你是谁、你的偏好是什么

这四个东西加在一起,就是 Hermes 的长期记忆系统。每次对话不是从零开始,它记得你之前做过什么、你的习惯是什么、哪些问题它已经学会了怎么解决。

从 Harness Engineering 的视角看 Hermes

这里我想多说两句,因为 Harness Engineering 和 Hermes Agent 这两个东西撞到一起,不是巧合。

我在写 Harness Engineering 那篇文章的时候,提炼出了三个核心要素:清晰的环境:Agent 能快速找到信息工具与技能:Agent 有手可以干活验收标准:Agent 知道做对了没有

你对照一下 Hermes 的架构,会发现它几乎就是按这个框架设计的。

持久层的 Memory + Profile 就是在给 Agent 提供清晰的环境,它不需要每次都重新理解你的项目背景。执行层的 28 个工具 + 6 种沙箱后端就是工具与技能。而 Skill 体系里内置的验证步骤,就是验收标准,Agent 干完活可以自己检查做对了没有。

但 Hermes 比 Harness Engineering 讲的又往前走了一步。

Harness Engineering 讲的是人来搭建这个工作环境。你得写好 CLAUDE.md,你得配好 MCP 工具,你得定义好验收标准。是人驾驭 AI。

Hermes 的自进化机制意味着:这些东西可以由Agent 自己来完善。它干完一个任务,会自己把流程存成 Skill(工具)、自己记住这次的经验(环境)、自己总结什么算做对了(标准)。

也就是说,Hermes 把 Harness Engineering 的三要素从人工搭建变成了自动生长。

Ryan 在那篇 Harness Engineering 的文章里说,给 Agent 的应该是一张地图,而不是一本 1000 页的说明书。Hermes 更进一步:它不光能看地图,还能自己画地图。

这是我觉得 Hermes 真正有意思的地方。不是因为它功能多,而是因为它代表了 AI Agent 从被驾驭到自驾驭的转变。

安装教程:从零到跑起来

说实话安装过程比我预想的顺利。我是直接用 Claude Code 帮我执行命令,全程大概十几分钟。

第一步:一行命令开装

打开终端,粘贴这行命令回车:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh| bash

它会自动帮你做这些事:检查并安装依赖(uv、Python 3.11、Node.js 22、Git 等),把仓库克隆到~/.hermes/hermes-agent,创建 Python 虚拟环境,下载 Playwright 的 Chromium 浏览器(这一步比较慢,165MB),最后把hermes命令链接到你的 PATH 里。

Windows 用户需要先装 WSL2,然后在 WSL 里跑这行命令。Mac 和 Linux 直接来就行。

第二步:安装完成

跑完之后你会看到这样的输出:

注意看它装了什么:仓库代码、Python 虚拟环境、Node.js 浏览器工具、WhatsApp 桥接依赖、78 个内置 Skill。对,开箱就有 78 个 Skill,覆盖了从 GitHub 代码审查、Obsidian 笔记、Google Workspace 到 Minecraft 服务器管理的各种场景。这个和 OpenClaw 需要你自己去 ClawHub 淘技能包的体验完全不同。

第三步:配置模型

接下来跑hermes setup,它会让你选模型和填 API key。

Hermes 支持的模型很全:Anthropic Claude、OpenAI、智谱 AI、KIMI、MiniMax、通义,甚至可以接 OpenRouter 调 200 多个模型。你用哪个就选哪个,不锁定厂商。

我选了直连 Anthropic,填完 API key 之后跑了一下hermes doctor,一切就绪:

到这一步,终端里已经可以用了。直接输入hermes就能开始对话。

这里提一嘴:Hermes 用的是 API 调用模式,不是你的 Claude Max 会员额度。你需要单独充值拿 API key,按 token 计费。如果想先免费体验,可以选 OpenRouter 或者 Nous Portal 的免费额度。

第四步:接入飞书

终端里跑起来之后,下一步自然是接入你日常用的聊天工具。Hermes 的Gateway支持 Telegram、Discord、Slack、微信、飞书、钉钉等一大堆平台。

我选了飞书,因为这是我日常办公用的。

流程也不复杂。在 Hermes 终端里直接说一句“帮我配置飞书 gateway”,它会自己查文档然后一步步引导你。核心就三件事:

  1. 去飞书开放平台创建一个企业自建应用,拿到 App ID 和 App Secret
  2. 启用机器人能力,在「事件与回调」里添加接收消息的事件权限
  3. 把 App ID 和 Secret 告诉 Hermes,它帮你写入配置并启动 Gateway

这里有个坑我要单独说一下:光在权限管理里添加消息权限不够,还需要在飞书开放平台的「事件与回调」页面添加事件订阅(接收消息 im.message.receive_v1),否则机器人收不到消息。

MD我卡在这里好一会儿,飞书那边显示一切正常,但机器人就是不回复。后来发现是少了这个事件订阅。

配置完成后,去飞书里找到你的机器人,发一条消息:

YES!。

如此,这不再是一个藏在终端里的技术工具了,它变成了一个可以在工作场景里直接用的 AI 助手!

我又追加了一个任务:让小美帮我总结 GitHub 上 Hermes Agent 项目的核心特点。

它直接在飞书里打开浏览器,自己导航到 GitHub 仓库,截图、滚动、分析页面内容,最后输出了一份完整的中文总结。全程我只发了一句话。

很快,因为我也接过openclaw、接过Claude code,但是体感上来看,Hermes 回复快,而且它调用什么工具、目前在干什么,这个也会直接发给我。

看着是不够美观,确实有点丑,但是起码有个进度的实时反馈,比openclaw好,之前在飞书上问openclaw,只回了我一个表情包,然后卡了半天才出结果,中间没任何反应。

它还能干什么

接入飞书之后,Hermes 解锁了一些终端做不了的玩法。

定时任务推送。你可以用自然语言设一个 cron 任务,比如“每天早上 9 点帮我抓取 GitHub trending 的前 5 个项目,生成简报发到飞书”。它会按时执行,结果直接推到你的飞书上。这就相当于给自己造了一个每天自动工作的 AI 助理,不需要你手动触发。这个能力 Claude Code 做不到,因为 Claude Code 不会自己启动。

跨平台上下文连续。在终端里让 Hermes 帮你分析一个代码仓库,做到一半出门了,打开飞书继续跟它聊,它知道你之前分析到哪了。这是因为持久层的 Session 和 Memory 是共享的,不管你从哪个入口进来,都是同一个“大脑”。这个体验有点像你给员工发了个微信消息,他不会因为换了个聊天工具就失忆了。

Skill 自进化。这是最值得展开说的一个。

你可以让 Hermes 操控本地的 Claude Code 写爬虫,全程零介入,10 分钟搞定,还自主验证了程序能不能跑。你品一下这个链路:人 → Hermes → Claude Code → 代码产出。连 Claude Code 都不用你直接碰。这就是 Multi-Agent 最直白的落地形态,让 AI 操控 AI!

但最关键的是任务完成之后发生的事。Hermes 主动把这套流程保存成了一个新的 Skill。下次再有类似任务,直接复用,不用从头来。这就是前面说的自进化闭环在实际场景里的样子。

透明的执行过程。这个不算什么大功能,但体验上很加分。Hermes 执行任务时会实时展示每一步在干什么:正在打开浏览器、正在读取文件、正在分析内容。即使你看不懂技术细节,也能直观感知它在工作。对于耗时较长的任务,它还会给进度提示。这解决了一个 OpenClaw 的老问题:你让它干活,然后它半天没反应,你不知道它是在工作还是已经崩了。

冷静说几个问题

实际测试中遇到的问题和限制,这些你用之前最好知道。

第一,它是本地进程,关电脑就停。Hermes 跑在你自己的机器上,你电脑关了或者休眠了,飞书上的小美就不会回复了。如果你想 24 小时在线,得把它部署到一台服务器或者 VPS 上。一台 5 块钱一个月的轻量云服务器就够跑。但这对于非技术用户来说还是有门槛的。

第二,rate limit 会卡住。我在用 Claude Opus 模型的时候遇到了 HTTP 429 限流,Hermes 上下文太大,一次性发了太多 token,直接被 Anthropic 的 API 限流了。它虽然会自动重试,但等待时间很长。解决办法是换一个 rate limit 更高的模型,或者用 OpenRouter 做中转。这个问题本质上还是 OpenClaw 时代就存在的 token 成本问题,没有完全绕过去。

第三,生态还很早期。Hermes 目前 50k+ stars,OpenClaw 350k+ stars。虽然增速猛,但绝对体量差了一个量级。OpenClaw 有 ClawHub 上 44000+ 个社区 Skill,Hermes 内置了 78 个,社区贡献的还在积累中。如果你需要一个特定领域的 Skill(比如操作某个企业内部系统),OpenClaw 的生态可能更成熟。

第四,安全问题需要注意。和 OpenClaw 一样,Hermes 拥有你本地系统的高权限。它能读写文件、执行命令、控制浏览器。你给它什么权限,它就有什么权限。虽然 v0.8.0 做了一轮安全加固(SSRF 防护、tar 遍历防护、凭证泄露保护),但本质上这类本地 Agent 的安全风险是结构性的。建议在 Docker 沙箱里跑,或者至少限制一下它的工具权限。

这些问题不是劝退,是让你心里有数。任何新工具都有磨合期,关键是你知道坑在哪里。

我的判断

写到这里,回头看这条线:Claude Code → OpenClaw → Hermes Agent

Claude Code 是个好工具,但你得盯着它干活。OpenClaw 往前走了一步,给了你远程控制和多平台接入的能力,但它的 Skill 体系需要你手动维护,成本问题也很头疼。

Hermes 的突破点不在于它功能多了多少,而在于它改变了人和 AI 之间的关系模式。

以前是你教它干活,它干完就忘。现在是它干完活还会自己写笔记、存经验、下次复用。你用得越多,它越顺手。

这让我想到一条更大的线。

如果你从 2024 年到现在看 AI 工具的演进,会发现一条很清晰的路径:

Prompt Engineering→Context Engineering→Harness Engineering→自进化 Agent

第一阶段,大家在研究怎么跟 AI 说话,怎么写提示词能让它输出更好的结果。这是对话层的事。

第二阶段,大家发现光说话不够,得给 AI 提供足够的上下文信息。RAG 火了,长上下文窗口火了,Context Engineering 这个词出来了。这还是信息层的事。

第三阶段,Harness Engineering 出来了,大家开始讨论的不再是怎么跟 AI 说话、给它什么信息,而是怎么给 AI 搭建一个能独立工作的环境。工具、流程、验收标准。这是系统层的事。

第四阶段,就是现在。Hermes 代表的方向是:Agent 不光能在你搭好的环境里工作,还能自己扩展这个环境。它会自己创造工具(Skill)、自己积累经验(Memory)、自己建立标准(验证步骤)。

每一个阶段,人在环里的参与度都在降低。从“你说一句它动一下”到“你搭好环境它自己干”再到“它自己搭环境自己干”。

这不是在说人会被替代。恰恰相反,人的角色在升级:从操作者,到设计者,到监督者。你不再需要手把手教 AI 每一步怎么做,你只需要告诉它目标是什么,然后看着它自己想办法。

这让我想到一个很朴素的道理:真正好用的工具,不是功能最强的那个,是越用越省心的那个。

Hermes 还很早期,bug 肯定有,生态也远不如 OpenClaw 成熟。但它指出了一个方向:AI Agent 不应该是一个你反复配置、反复教的工具,它应该是一个跟你一起成长的搭档。

Harness Engineering 教我们怎么驾驭 AI。Hermes Agent 让 AI 开始驾驭自己。

这两件事加在一起,可能就是 2026 年 AI 工具演进最重要的一条线。

本文由 @小普 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自作者提供

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!