还没来得及学OpenClaw，来了个更猛的：Hermes Agent

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

还没来得及学OpenClaw，来了个更猛的：Hermes Agent

小普

2026-04-12

0 评论 450 浏览 2 收藏

26 分钟

AI Agent领域再迎重磅选手，Hermes Agent以开源姿态两个月斩获50k+ stars，其自进化机制彻底颠覆传统AI助手逻辑。从OpenClaw的技能手动安装到Hermes的自主技能生成，这场AI自治革命正在改写人机协作规则。本文将深度剖析其四层架构与双轨进化体系，揭示从‘人驾驭AI’到‘AI驾驭自己’的技术跃迁。

还没来得及玩 OpenClaw 的可以直接跳过了，现在来了一个更猛的 AI Agent：Hermes Agent。

所以真的是：只要你学得够慢，就不用学了。

前两天刷 B 站的时候，看到一个视频标题带 Hermes 这个词，我第一反应是：这不是 Harness Engineering 吗？谁打错字了？

因为就在前段时间我刚写过那篇 Harness Engineering 的文章，讲的是怎么给 AI Agent 搭工作环境、怎么驾驭 AI 干活。两个词长得实在太像了，Harness，Hermes。

点进去一看，不是打错字。

是 Nous Research 搞的一个全新的开源项目，GitHub 上两个月冲到 50k+ stars。什么概念？OpenClaw 从去年 11 月开源到现在，虽然 stars 已经飙到了 350k+，但人家好歹用了小半年。Hermes 这个速度，说实话感觉更刺激。

说到 OpenClaw，我之前专门写过一篇文章分析过它。结论就两个字：能打，但也真贵。

它的 Token 消耗是海量级的，有用户一晚上跑了 570 万 token，账单直接爆了。而且想让它在你的特定场景上好用，你得拿 SFT 数据去微调，这个门槛比大多数人想象的高太多。

如果说OpenClaw 展示了一个激动人心的未来，那通往那个未来的路上有两座大山：钱和时间。

所以当我看到 Hermes Agent 的时候，我最关心的不是它又多了什么功能，而是：它有没有绕过这两座山？

但真正让我觉得有意思的不是这个问题本身，是这两个词背后的趋势。

Harness Engineering 讲的是人怎么驾驭 AI。Hermes Agent 讲的是 AI 怎么驾驭自己。

你看这条线：Claude Code 是个终端编程工具，你得坐在电脑前盯着它干活；OpenClaw 往前走了一步，你可以用手机远程指挥它，但你还是得手动给它装 Skill、喂数据、培养它；而 Hermes 又往前走了一步，它干完活之后，会自己把这套流程保存成 Skill，下次直接复用。

从你教它干活，到它自己学会干活。

我也是边写边装，安装截图一并放进来，你可以跟着上手。

Hermes Agent 是什么

先说清楚它不是什么。

它不是一个套壳聊天机器人，不是一个 IDE 里的代码补全插件，也不是 OpenClaw 换了个名字。

Hermes Agent 是 Nous Research 做的一个开源 AI 智能体运行时。它是一个可以 7×24 小时跑在你电脑或者服务器上的 AI 助手，有记忆、有技能、有多个聊天入口，而且会自我进化。

这个项目 2026 年 2 月开源，到 4 月 8 号发布 v0.8.0 的时候已经 51.8k stars，6.7k forks。增速确实猛。

做这个项目的 Nous Research 你可能没听过，但在开源 AI 社区里挺有名的。他们之前做过一系列 Hermes 微调模型，在 HuggingFace 上排名一直靠前。这次做 Hermes Agent，算是从模型层往上走了一步，直接做了一个完整的 Agent 框架。

和 OpenClaw 到底有什么区别

很多人第一反应都是：这不就是另一个 OpenClaw 吗？

功能层面确实有重叠。两个项目都支持多平台接入（Telegram、Discord、Slack、微信等），都能调用各种大模型，都有本地执行能力。甚至 Hermes 还内置了 OpenClaw 的迁移工具，一行命令hermes claw migrate就能把你在 OpenClaw 里的配置、记忆、技能、API key 全部导过来。

但核心差异在一个词：自进化。

OpenClaw 的 Skill 体系是个手动生态。你去 ClawHub 上找别人写好的 Skill，下载安装，然后用。用着用着发现不好使，你得自己改，或者拿 SFT 数据去微调。

我之前写 OpenClaw 那篇文章就提过，这个培养过程的时间成本和经济成本都很高，普通用户根本玩不转。

Hermes 的做法不一样。它有一个内置的学习闭环：

执行任务 → 遇到问题自主修正 → 任务完成后主动把流程保存为 Skill → 下次类似任务直接调用 → Skill 在使用中持续改进。

这不是一个可选功能，是默认行为。你不需要配置什么自动学习开关，它就是这么设计的。

所以你看，同样是 Skill 体系，OpenClaw 是被动扩展，你得手动装、手动教；Hermes 是主动成长，它自己学、自己存、自己迭代。

这个区别不是功能多少的问题，是本质上就不一样。

打个比方：OpenClaw 像一个你得手把手教的实习生，你教他做报表，下次换个格式他又不会了。Hermes 像一个会自己写工作笔记的新同事，你教一遍他记一遍，下次同样的活不用你再说了，而且他的笔记会越写越精。

而且 Nous Research 还单独出了一个配套项目叫hermes-agent-self-evolution，用 DSPy + GEPA来做离线自我优化。它会读取 Agent 的执行 trace，分析哪里失败了、为什么失败，然后生成改进方案，跑评估，最好的方案直接提 PR。

所以 Hermes 实际上有两层进化：运行时学习（在线）+ 进化优化（离线）。这个架构野心不小。

四层架构

Hermes 的系统结构分四层，理解了这个架构你就知道它在干什么：

入口层：CLI 命令行 + Gateway 多平台网关。你可以在终端里跟它聊，也可以在 Telegram、微信、飞书、Discord、WhatsApp、钉钉上跟它对话，上下文是同步的。这意味着你在电脑前开始一个任务，出门之后在手机上继续跟它聊，它知道你之前做到哪了。

Agent 层：大脑。负责调用大模型做思考和决策，管理 prompt 和工具调度。支持 Nous Portal、OpenRouter、智谱 AI、KIMI、MiniMax、OpenAI 等，用hermes model一键切换，不锁定任何厂商。这点比 OpenClaw 早期强制绑定特定模型要灵活很多。而且它支持fallback 链，主模型挂了自动切备用，不会中断任务。

执行层：手和脚。内置 28 个工具，能操作文件、跑代码、控制浏览器、对接 MCP 服务。有 6 种代码执行后端（本地、Docker、SSH、Daytona、Singularity、Modal），支持安全隔离。也就是说它跑代码的时候可以在沙箱里跑，不会把你的系统搞崩。这个对于让 Agent 自主执行任务来说非常重要，因为你不可能让一个 AI 随便在你的生产环境里乱搞。

持久层：记忆。这一层是 Hermes 区别于其他 Agent 的核心，所有的“成长”都发生在这里。它有四个组件：

Session：会话记录，支持跨平台同步
Memory：长期记忆，用 SQLite FTS5 做全文搜索，加上 LLM 摘要做跨会话回忆
Skill：技能文档，遵循 agentskills.io 开放标准，跨 Agent 兼容
Profile：用户画像，集成了 Honcho 辩证用户建模，它会持续理解你是谁、你的偏好是什么

这四个东西加在一起，就是 Hermes 的长期记忆系统。每次对话不是从零开始，它记得你之前做过什么、你的习惯是什么、哪些问题它已经学会了怎么解决。

从 Harness Engineering 的视角看 Hermes

这里我想多说两句，因为 Harness Engineering 和 Hermes Agent 这两个东西撞到一起，不是巧合。

我在写 Harness Engineering 那篇文章的时候，提炼出了三个核心要素：清晰的环境：Agent 能快速找到信息工具与技能：Agent 有手可以干活验收标准：Agent 知道做对了没有

你对照一下 Hermes 的架构，会发现它几乎就是按这个框架设计的。

持久层的 Memory + Profile 就是在给 Agent 提供清晰的环境，它不需要每次都重新理解你的项目背景。执行层的 28 个工具 + 6 种沙箱后端就是工具与技能。而 Skill 体系里内置的验证步骤，就是验收标准，Agent 干完活可以自己检查做对了没有。

但 Hermes 比 Harness Engineering 讲的又往前走了一步。

Harness Engineering 讲的是人来搭建这个工作环境。你得写好 CLAUDE.md，你得配好 MCP 工具，你得定义好验收标准。是人驾驭 AI。

Hermes 的自进化机制意味着：这些东西可以由Agent 自己来完善。它干完一个任务，会自己把流程存成 Skill（工具）、自己记住这次的经验（环境）、自己总结什么算做对了（标准）。

也就是说，Hermes 把 Harness Engineering 的三要素从人工搭建变成了自动生长。

Ryan 在那篇 Harness Engineering 的文章里说，给 Agent 的应该是一张地图，而不是一本 1000 页的说明书。Hermes 更进一步：它不光能看地图，还能自己画地图。

这是我觉得 Hermes 真正有意思的地方。不是因为它功能多，而是因为它代表了 AI Agent 从被驾驭到自驾驭的转变。

安装教程：从零到跑起来

说实话安装过程比我预想的顺利。我是直接用 Claude Code 帮我执行命令，全程大概十几分钟。

第一步：一行命令开装

打开终端，粘贴这行命令回车：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh| bash

它会自动帮你做这些事：检查并安装依赖（uv、Python 3.11、Node.js 22、Git 等），把仓库克隆到~/.hermes/hermes-agent，创建 Python 虚拟环境，下载 Playwright 的 Chromium 浏览器（这一步比较慢，165MB），最后把hermes命令链接到你的 PATH 里。

Windows 用户需要先装 WSL2，然后在 WSL 里跑这行命令。Mac 和 Linux 直接来就行。

第二步：安装完成

跑完之后你会看到这样的输出：

注意看它装了什么：仓库代码、Python 虚拟环境、Node.js 浏览器工具、WhatsApp 桥接依赖、78 个内置 Skill。对，开箱就有 78 个 Skill，覆盖了从 GitHub 代码审查、Obsidian 笔记、Google Workspace 到 Minecraft 服务器管理的各种场景。这个和 OpenClaw 需要你自己去 ClawHub 淘技能包的体验完全不同。

第三步：配置模型

接下来跑hermes setup，它会让你选模型和填 API key。

Hermes 支持的模型很全：Anthropic Claude、OpenAI、智谱 AI、KIMI、MiniMax、通义，甚至可以接 OpenRouter 调 200 多个模型。你用哪个就选哪个，不锁定厂商。

我选了直连 Anthropic，填完 API key 之后跑了一下hermes doctor，一切就绪：

到这一步，终端里已经可以用了。直接输入hermes就能开始对话。

这里提一嘴：Hermes 用的是 API 调用模式，不是你的 Claude Max 会员额度。你需要单独充值拿 API key，按 token 计费。如果想先免费体验，可以选 OpenRouter 或者 Nous Portal 的免费额度。

第四步：接入飞书

终端里跑起来之后，下一步自然是接入你日常用的聊天工具。Hermes 的Gateway支持 Telegram、Discord、Slack、微信、飞书、钉钉等一大堆平台。

我选了飞书，因为这是我日常办公用的。

流程也不复杂。在 Hermes 终端里直接说一句“帮我配置飞书 gateway”，它会自己查文档然后一步步引导你。核心就三件事：

去飞书开放平台创建一个企业自建应用，拿到 App ID 和 App Secret
启用机器人能力，在「事件与回调」里添加接收消息的事件权限
把 App ID 和 Secret 告诉 Hermes，它帮你写入配置并启动 Gateway

这里有个坑我要单独说一下：光在权限管理里添加消息权限不够，还需要在飞书开放平台的「事件与回调」页面添加事件订阅（接收消息 im.message.receive_v1），否则机器人收不到消息。

MD我卡在这里好一会儿，飞书那边显示一切正常，但机器人就是不回复。后来发现是少了这个事件订阅。

配置完成后，去飞书里找到你的机器人，发一条消息：

YES！。

如此，这不再是一个藏在终端里的技术工具了，它变成了一个可以在工作场景里直接用的 AI 助手！

我又追加了一个任务：让小美帮我总结 GitHub 上 Hermes Agent 项目的核心特点。

它直接在飞书里打开浏览器，自己导航到 GitHub 仓库，截图、滚动、分析页面内容，最后输出了一份完整的中文总结。全程我只发了一句话。

很快，因为我也接过openclaw、接过Claude code，但是体感上来看，Hermes 回复快，而且它调用什么工具、目前在干什么，这个也会直接发给我。

看着是不够美观，确实有点丑，但是起码有个进度的实时反馈，比openclaw好，之前在飞书上问openclaw，只回了我一个表情包，然后卡了半天才出结果，中间没任何反应。

它还能干什么

接入飞书之后，Hermes 解锁了一些终端做不了的玩法。

定时任务推送。你可以用自然语言设一个 cron 任务，比如“每天早上 9 点帮我抓取 GitHub trending 的前 5 个项目，生成简报发到飞书”。它会按时执行，结果直接推到你的飞书上。这就相当于给自己造了一个每天自动工作的 AI 助理，不需要你手动触发。这个能力 Claude Code 做不到，因为 Claude Code 不会自己启动。

跨平台上下文连续。在终端里让 Hermes 帮你分析一个代码仓库，做到一半出门了，打开飞书继续跟它聊，它知道你之前分析到哪了。这是因为持久层的 Session 和 Memory 是共享的，不管你从哪个入口进来，都是同一个“大脑”。这个体验有点像你给员工发了个微信消息，他不会因为换了个聊天工具就失忆了。

Skill 自进化。这是最值得展开说的一个。

你可以让 Hermes 操控本地的 Claude Code 写爬虫，全程零介入，10 分钟搞定，还自主验证了程序能不能跑。你品一下这个链路：人 → Hermes → Claude Code → 代码产出。连 Claude Code 都不用你直接碰。这就是 Multi-Agent 最直白的落地形态，让 AI 操控 AI！

但最关键的是任务完成之后发生的事。Hermes 主动把这套流程保存成了一个新的 Skill。下次再有类似任务，直接复用，不用从头来。这就是前面说的自进化闭环在实际场景里的样子。

透明的执行过程。这个不算什么大功能，但体验上很加分。Hermes 执行任务时会实时展示每一步在干什么：正在打开浏览器、正在读取文件、正在分析内容。即使你看不懂技术细节，也能直观感知它在工作。对于耗时较长的任务，它还会给进度提示。这解决了一个 OpenClaw 的老问题：你让它干活，然后它半天没反应，你不知道它是在工作还是已经崩了。

冷静说几个问题

实际测试中遇到的问题和限制，这些你用之前最好知道。

第一，它是本地进程，关电脑就停。Hermes 跑在你自己的机器上，你电脑关了或者休眠了，飞书上的小美就不会回复了。如果你想 24 小时在线，得把它部署到一台服务器或者 VPS 上。一台 5 块钱一个月的轻量云服务器就够跑。但这对于非技术用户来说还是有门槛的。

第二，rate limit 会卡住。我在用 Claude Opus 模型的时候遇到了 HTTP 429 限流，Hermes 上下文太大，一次性发了太多 token，直接被 Anthropic 的 API 限流了。它虽然会自动重试，但等待时间很长。解决办法是换一个 rate limit 更高的模型，或者用 OpenRouter 做中转。这个问题本质上还是 OpenClaw 时代就存在的 token 成本问题，没有完全绕过去。

第三，生态还很早期。Hermes 目前 50k+ stars，OpenClaw 350k+ stars。虽然增速猛，但绝对体量差了一个量级。OpenClaw 有 ClawHub 上 44000+ 个社区 Skill，Hermes 内置了 78 个，社区贡献的还在积累中。如果你需要一个特定领域的 Skill（比如操作某个企业内部系统），OpenClaw 的生态可能更成熟。

第四，安全问题需要注意。和 OpenClaw 一样，Hermes 拥有你本地系统的高权限。它能读写文件、执行命令、控制浏览器。你给它什么权限，它就有什么权限。虽然 v0.8.0 做了一轮安全加固（SSRF 防护、tar 遍历防护、凭证泄露保护），但本质上这类本地 Agent 的安全风险是结构性的。建议在 Docker 沙箱里跑，或者至少限制一下它的工具权限。

这些问题不是劝退，是让你心里有数。任何新工具都有磨合期，关键是你知道坑在哪里。