我用了一周Hermes Agent,它让我重新理解了什么叫”AI真正的记忆”
开源项目Hermes Agent正在颠覆我们对AI助手的认知。它通过创新的三层记忆架构与闭环学习机制,解决了传统Agent最致命的'失忆'问题。无论是跨平台信息整合、长期项目管理还是并行任务处理,这款工具都展现出与众不同的设计哲学。对于AI产品从业者而言,它不仅是生产力工具,更揭示了Agent产品未来的竞争维度。

最近圈子里讨论最多的 Agent,不是 Claude Code,也不是 Cursor 的新功能——而是一个叫 Hermes Agent 的开源项目,来自 Nous Research。
我第一次看到它的时候,下意识的反应是:”又一个包了 LLM 的 Agent 壳子。”
但真正用下来之后,我改变了这个判断。它在某个很核心的问题上做了和其他人不同的设计选择——而这个选择,恰好戳到了我做 AI 产品这一年多以来一直没解决的痛点。
这篇文章,我想从一个 AI 产品从业者的视角,认认真真拆一下这个产品:它解决了什么问题、怎么解决的、有哪些真实的用法,以及——它对我们做 AI 产品有什么启发。
一、先说背景:Nous Research 是谁
很多人知道 Claude、GPT,但不一定知道 Nous Research。
Nous Research 是一家专注于开源大模型研究的 AI 实验室,他们最知名的产品是 Hermes 系列模型——这是目前开源社区里工具调用(function calling)能力最强的模型之一。Hermes 4 在 2025 年引入了混合推理和大规模合成数据生成,是很多开发者跑本地 Agent 的首选基础模型。
他们还做过 DisTrO(跨全球消费级显卡的分布式训练框架)、WorldSim(多 Agent 交互仿真环境)等偏研究向的项目。
简单说:这是一家既训模型又做基础设施的团队,Hermes Agent 是他们把这两条线融合之后的产物。
二、大多数 Agent 的根本问题:它们没有真正的记忆

在聊 Hermes Agent 具体做什么之前,我想先说一个更底层的问题。
过去一年,我测试过不少 Agent 产品。用起来的感受大致是这样的:
第一次对话,感觉很聪明
第三次对话,开始要重新解释背景
第十次对话,和第一次没有任何区别
它们没有学习。它们只有上下文窗口。
这不是批评,这是一个技术现实:大多数 Agent 的”记忆”本质上是一段塞进 prompt 的文本。下一次会话开始,这段文本消失了。你和它说的每一句话,对它来说都是陌生的开始。
这个问题在个人使用场景下只是”麻烦”,但在实际业务场景里是真正的痛——我们在做 Vesper 的时候,AI 陪伴角色的”失忆感”是用户流失的核心原因之一。用户跟 AI 说了一堆私密的事情,隔了几天再回来,AI 完全不记得,用户的信任感瞬间崩塌。
这个问题,Hermes Agent 给出了一个我见过的最系统的回答。
三、Hermes Agent 的核心设计:闭环学习机制
Hermes Agent 的官方定位是:“The agent that grows with you”(随你成长的 Agent)。
这句话不是 slogan,是它的核心架构逻辑。
它做了一件其他 Agent 基本没有做到的事:把记忆分成了三个层次,并且让这三层之间可以自动流动。

第一层:会话记忆(Session Memory)
每次对话的内容,通过 FTS5(SQLite 全文索引)存入本地数据库,并由 LLM 自动做摘要压缩。下次开始新对话时,Agent 会主动检索历史,把相关内容召回。
这不是简单的”存日志”——它有跨会话的语义检索能力,找的是相关性,不是按时间线硬翻。
第二层:知识记忆(Persistent Memory)
Agent 会在对话过程中,主动判断哪些信息值得长期保存——你的偏好、你的项目背景、你反复提到的上下文。它会把这些提炼成结构化的记忆条目,持久存储。
更重要的是:它会主动 nudge 自己去记。这里用了一个叫 Honcho 的组件(来自 Plastic Labs),做”辩证式用户建模”——不只是存你说了什么,而是尝试建立你这个人的心智模型。
第三层:技能记忆(Skills System)
这一层是我认为最有创意的设计。
当 Agent 帮你完成了一个复杂任务之后,它会自动把这个”解决方案”提炼成一个可复用的 Skill 文件。下次遇到类似任务,它不需要从头想,直接调用这个 Skill,并且在调用过程中持续改进它。
Skills 是标准化的文件格式,兼容 agentskills.io 这个开放社区——你可以把自己的 Skill 分享出去,也可以从社区下载别人写好的 Skill。
这三层加在一起,构成了官方说的 “闭环学习回路(Closed Learning Loop)”。
用大白话说:它用得越多,越懂你,也越能干。
这在逻辑上就和大多数 Agent 产品拉开了代差。
四、它住在哪里:不绑定你的电脑
Hermes Agent 的另一个重要设计是:它不依附于你的笔记本。
大多数 Agent(包括早期的 Claude Code)是”进程型”的——你开电脑,打开终端,才有 Agent。你关电脑,Agent 停止工作,记忆中断。
Hermes Agent 的设计思路是:让 Agent 活在服务器上,你通过消息平台跟它交互。
它支持的部署环境包括:本地、Docker、SSH 远程服务器、Daytona、Singularity、Modal。其中 Daytona 和 Modal 是 serverless 的,空闲时自动休眠,几乎不花钱——官方说一台 $5/月的 VPS 就能跑起来。
消息入口支持:CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、飞书、WeCom、Home Assistant……15+ 个平台,统一从一个 Gateway 进程处理。
这意味着一个非常有趣的使用模式:你可以在手机 Telegram 上给它发任务,它在云服务器上跑,任务完成后推送结果给你。你从来不需要 SSH 进去。
对于我这种需要同时管理多个信息流的人来说,这个设计的吸引力非常大。
五、真实用法:我是怎么用它的
说了这么多架构,讲点实际的。
用法一:作为跨平台的信息助手
我在飞书上配置了 Hermes Agent 的接入(它原生支持飞书)。现在我可以直接在飞书聊天框里给它发指令,它会搜索、整理、总结,然后回复我。
对我来说最有用的场景是:早上 8 点的自动简报。我用它的 cron 调度功能,设置了一个每天定时任务:自动搜索我关注的几个关键词(竞品动态、AI 行业新闻、特定公司融资动态),整理成简报,发到我的飞书。
整个设置过程是自然语言的——我直接告诉它我想要什么,它帮我生成 cron 配置并注册。
用法二:长期项目的上下文管理
做 Vesper 的这段时间,我经常需要反复跟 AI 解释同一套上下文:用户画像、产品逻辑、竞品情况、当前阶段……每次开新对话都要重来一遍,效率很低。
Hermes Agent 的 Context Files 功能解决了这个问题:你可以在项目目录下放一个 CONTEXT.md 文件,每次 Agent 进入这个目录,这个文件的内容会自动注入到对话的上下文里。
结合 Skills 系统,现在我在这个项目上的常见任务(比如”分析一段用户反馈并给出产品建议”)都被提炼成了 Skill 文件——调用效率大幅提升,而且随着使用,这些 Skill 会自动优化。
用法三:并行子 Agent 工作流
这是一个稍微高级一点的用法。
Hermes Agent 支持派生子 Agent(Subagents)——主 Agent 可以把一个大任务拆分成几个子任务,分别交给独立的 Agent 实例去完成,每个实例有自己独立的上下文和终端。
我用这个功能做过竞品分析:主 Agent 负责汇总报告,分别派出三个子 Agent 分析三个不同平台的用户评价,并行执行。速度比串行快很多,而且不会互相干扰上下文。
六、它的模型无关性:这也是一个产品决策
Hermes Agent 支持切换底层模型,覆盖:Nous Portal(400+ 模型)、OpenRouter(200+ 模型)、OpenAI、Anthropic(Claude)、xAI(Grok)、Kimi/Moonshot、MiniMax、GLM、Ollama 本地模型……
切换命令只有一行:hermes model
这个设计看起来平常,但背后是一个很重要的产品理念:不要让 Agent 框架绑定模型选择。
对于我们这些做 AI 产品的人来说,这一点尤其值得思考。很多 Agent 产品的护城河来自”绑定最好的模型”——但当模型能力快速迭代、价格快速下降的时候,这个护城河会不断被侵蚀。
真正的护城河,是记忆、技能、工作流这些用户数据层面的积累——这些东西是用户自己产生的,换一个框架就要重新来过,迁移成本极高。
Hermes Agent 在这个问题上选择了正确的方向。
七、从 PM 视角:它给我的三个产品启发
写到这里,我想跳出用户视角,谈一些更产品层面的思考。
启发一:记忆系统是 AI 产品的基础设施,不是功能点
很多 AI 产品把”记忆”当作一个功能来开发——加个记忆开关,存几条用户偏好,显示在设置页面。这种理解方式太浅了。
Hermes Agent 的记忆系统是一个三层架构,有检索机制、有摘要压缩、有主动 nudge 逻辑、有用户建模。它是整个产品的底层基础设施。
在做 Vesper 的过程中,我们也在不断往这个方向迭代。AI 陪伴产品如果没有真正的记忆深度,就是一个会说话的 FAQ。
启发二:Skills 系统本质上是”程序化记忆”,是 AI 产品的飞轮
Hermes Agent 的 Skill 不只是宏,它是从经验中抽象出来的可执行程序。
这让我想到一个类比:一个优秀的 PM 助手,不只是记住你说过什么,而是学会了你处理问题的方式。这才是真正的”成长”。
Skills 系统带来的飞轮效应非常强:用得越多 → 生成越多 Skill → 处理效率越高 → 用得越频繁。这种正向循环,是很多 Agent 产品目前缺少的留存机制。
启发三:跨平台触达 × 持久化运行 = Agent 的下一个形态
我们现在习惯于用”打开 App”的方式使用 AI 工具。但 Hermes Agent 的形态是:AI 一直在那,你通过任何渠道找它。
这和我们理解”助手”的方式更一致——你不会每次需要助手的时候都重新激活他、重新介绍背景。你只需要发一条消息,他接着上次继续。
我认为这是 Agent 产品的下一个竞争维度:谁能做到真正的持久化存在感。

八、它目前的局限
写这篇文章不是为了做广告,所以局限也要讲清楚。
上手门槛不低。 安装和配置需要在终端操作,虽然有一键脚本,但对没有技术背景的用户不友好。它更适合开发者和有技术背景的 PM,普通用户暂时很难直接用。
Windows 不支持。 目前只支持 Linux、macOS、WSL2,对 Windows 用户不友好。
Skills 质量不稳定。 自动生成的 Skill 质量参差不齐,有时候会生成很冗余或者不够准确的 Skill,需要人工检查和修正。
多 Agent 协作还在早期。 子 Agent 功能虽然有,但复杂任务的调度和错误处理逻辑还不够完善,踩过几次坑。
九、它为什么值得关注
这个问题我最后回答。
Hermes Agent 不是功能最多的 Agent,也不是最容易上手的 Agent。但它在一件事上想得比别人更清楚:
AI Agent 的价值,不在于它调用了多少工具、接了多少平台,而在于它和用户的关系是否在随着时间变得更深、更有效。
从这个角度看,它构建的是一个关系型 AI 产品——每一次交互不只是完成任务,而是在加深它对你的理解,积累可复用的能力,形成越来越难以迁移的用户价值。
这个方向,我认为是对的。
而且,它是开源的,MIT 协议,GitHub 上公开全部代码。这意味着任何人都可以在这个基础上做二次开发、做商业化产品。
对于正在做 AI 产品的从业者来说,这不只是一个可以用的工具——它也是一个可以学习的产品样本。
最后说一句: AI 的竞争,已经从”谁的模型更聪明”,进入了”谁能让 Agent 真正陪着用户成长”的阶段。Hermes Agent 给出了它的答案。你的答案是什么?
本文由 @昀琪琪的AI世界 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自作者提供
- 目前还没评论,等你发挥!

起点课堂会员权益




