我用了一周Hermes Agent，它让我重新理解了什么叫”AI真正的记忆”

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

我用了一周Hermes Agent，它让我重新理解了什么叫”AI真正的记忆”

昀琪琪的AI世界

2026-04-14

0 评论 2231 浏览 3 收藏

17 分钟

开源项目Hermes Agent正在颠覆我们对AI助手的认知。它通过创新的三层记忆架构与闭环学习机制，解决了传统Agent最致命的'失忆'问题。无论是跨平台信息整合、长期项目管理还是并行任务处理，这款工具都展现出与众不同的设计哲学。对于AI产品从业者而言，它不仅是生产力工具，更揭示了Agent产品未来的竞争维度。

最近圈子里讨论最多的 Agent，不是 Claude Code，也不是 Cursor 的新功能——而是一个叫 Hermes Agent 的开源项目，来自 Nous Research。

我第一次看到它的时候，下意识的反应是：”又一个包了 LLM 的 Agent 壳子。”

但真正用下来之后，我改变了这个判断。它在某个很核心的问题上做了和其他人不同的设计选择——而这个选择，恰好戳到了我做 AI 产品这一年多以来一直没解决的痛点。

这篇文章，我想从一个 AI 产品从业者的视角，认认真真拆一下这个产品：它解决了什么问题、怎么解决的、有哪些真实的用法，以及——它对我们做 AI 产品有什么启发。

一、先说背景：Nous Research 是谁

很多人知道 Claude、GPT，但不一定知道 Nous Research。

Nous Research 是一家专注于开源大模型研究的 AI 实验室，他们最知名的产品是 Hermes 系列模型——这是目前开源社区里工具调用（function calling）能力最强的模型之一。Hermes 4 在 2025 年引入了混合推理和大规模合成数据生成，是很多开发者跑本地 Agent 的首选基础模型。

他们还做过 DisTrO（跨全球消费级显卡的分布式训练框架）、WorldSim（多 Agent 交互仿真环境）等偏研究向的项目。

简单说：这是一家既训模型又做基础设施的团队，Hermes Agent 是他们把这两条线融合之后的产物。

二、大多数 Agent 的根本问题：它们没有真正的记忆

在聊 Hermes Agent 具体做什么之前，我想先说一个更底层的问题。

过去一年，我测试过不少 Agent 产品。用起来的感受大致是这样的：

第一次对话，感觉很聪明

第三次对话，开始要重新解释背景

第十次对话，和第一次没有任何区别

它们没有学习。它们只有上下文窗口。

这不是批评，这是一个技术现实：大多数 Agent 的”记忆”本质上是一段塞进 prompt 的文本。下一次会话开始，这段文本消失了。你和它说的每一句话，对它来说都是陌生的开始。

这个问题在个人使用场景下只是”麻烦”，但在实际业务场景里是真正的痛——我们在做 Vesper 的时候，AI 陪伴角色的”失忆感”是用户流失的核心原因之一。用户跟 AI 说了一堆私密的事情，隔了几天再回来，AI 完全不记得，用户的信任感瞬间崩塌。

这个问题，Hermes Agent 给出了一个我见过的最系统的回答。

三、Hermes Agent 的核心设计：闭环学习机制

Hermes Agent 的官方定位是：“The agent that grows with you”（随你成长的 Agent）。

这句话不是 slogan，是它的核心架构逻辑。

它做了一件其他 Agent 基本没有做到的事：把记忆分成了三个层次，并且让这三层之间可以自动流动。

第一层：会话记忆（Session Memory）

每次对话的内容，通过 FTS5（SQLite 全文索引）存入本地数据库，并由 LLM 自动做摘要压缩。下次开始新对话时，Agent 会主动检索历史，把相关内容召回。

这不是简单的”存日志”——它有跨会话的语义检索能力，找的是相关性，不是按时间线硬翻。

第二层：知识记忆（Persistent Memory）

Agent 会在对话过程中，主动判断哪些信息值得长期保存——你的偏好、你的项目背景、你反复提到的上下文。它会把这些提炼成结构化的记忆条目，持久存储。

更重要的是：它会主动 nudge 自己去记。这里用了一个叫 Honcho 的组件（来自 Plastic Labs），做”辩证式用户建模”——不只是存你说了什么，而是尝试建立你这个人的心智模型。

第三层：技能记忆（Skills System）

这一层是我认为最有创意的设计。

当 Agent 帮你完成了一个复杂任务之后，它会自动把这个”解决方案”提炼成一个可复用的 Skill 文件。下次遇到类似任务，它不需要从头想，直接调用这个 Skill，并且在调用过程中持续改进它。

Skills 是标准化的文件格式，兼容 agentskills.io 这个开放社区——你可以把自己的 Skill 分享出去，也可以从社区下载别人写好的 Skill。

这三层加在一起，构成了官方说的 “闭环学习回路（Closed Learning Loop）”。

用大白话说：它用得越多，越懂你，也越能干。

这在逻辑上就和大多数 Agent 产品拉开了代差。

四、它住在哪里：不绑定你的电脑

Hermes Agent 的另一个重要设计是：它不依附于你的笔记本。

大多数 Agent（包括早期的 Claude Code）是”进程型”的——你开电脑，打开终端，才有 Agent。你关电脑，Agent 停止工作，记忆中断。

Hermes Agent 的设计思路是：让 Agent 活在服务器上，你通过消息平台跟它交互。

它支持的部署环境包括：本地、Docker、SSH 远程服务器、Daytona、Singularity、Modal。其中 Daytona 和 Modal 是 serverless 的，空闲时自动休眠，几乎不花钱——官方说一台 $5/月的 VPS 就能跑起来。

消息入口支持：CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、飞书、WeCom、Home Assistant……15+ 个平台，统一从一个 Gateway 进程处理。

这意味着一个非常有趣的使用模式：你可以在手机 Telegram 上给它发任务，它在云服务器上跑，任务完成后推送结果给你。你从来不需要 SSH 进去。

对于我这种需要同时管理多个信息流的人来说，这个设计的吸引力非常大。

五、真实用法：我是怎么用它的

说了这么多架构，讲点实际的。

用法一：作为跨平台的信息助手

我在飞书上配置了 Hermes Agent 的接入（它原生支持飞书）。现在我可以直接在飞书聊天框里给它发指令，它会搜索、整理、总结，然后回复我。

对我来说最有用的场景是：早上 8 点的自动简报。我用它的 cron 调度功能，设置了一个每天定时任务：自动搜索我关注的几个关键词（竞品动态、AI 行业新闻、特定公司融资动态），整理成简报，发到我的飞书。

整个设置过程是自然语言的——我直接告诉它我想要什么，它帮我生成 cron 配置并注册。

用法二：长期项目的上下文管理

做 Vesper 的这段时间，我经常需要反复跟 AI 解释同一套上下文：用户画像、产品逻辑、竞品情况、当前阶段……每次开新对话都要重来一遍，效率很低。

Hermes Agent 的 Context Files 功能解决了这个问题：你可以在项目目录下放一个 CONTEXT.md 文件，每次 Agent 进入这个目录，这个文件的内容会自动注入到对话的上下文里。

结合 Skills 系统，现在我在这个项目上的常见任务（比如”分析一段用户反馈并给出产品建议”）都被提炼成了 Skill 文件——调用效率大幅提升，而且随着使用，这些 Skill 会自动优化。

用法三：并行子 Agent 工作流

这是一个稍微高级一点的用法。

Hermes Agent 支持派生子 Agent（Subagents）——主 Agent 可以把一个大任务拆分成几个子任务，分别交给独立的 Agent 实例去完成，每个实例有自己独立的上下文和终端。

我用这个功能做过竞品分析：主 Agent 负责汇总报告，分别派出三个子 Agent 分析三个不同平台的用户评价，并行执行。速度比串行快很多，而且不会互相干扰上下文。

六、它的模型无关性：这也是一个产品决策

Hermes Agent 支持切换底层模型，覆盖：Nous Portal（400+ 模型）、OpenRouter（200+ 模型）、OpenAI、Anthropic（Claude）、xAI（Grok）、Kimi/Moonshot、MiniMax、GLM、Ollama 本地模型……

切换命令只有一行：hermes model

这个设计看起来平常，但背后是一个很重要的产品理念：不要让 Agent 框架绑定模型选择。

对于我们这些做 AI 产品的人来说，这一点尤其值得思考。很多 Agent 产品的护城河来自”绑定最好的模型”——但当模型能力快速迭代、价格快速下降的时候，这个护城河会不断被侵蚀。

真正的护城河，是记忆、技能、工作流这些用户数据层面的积累——这些东西是用户自己产生的，换一个框架就要重新来过，迁移成本极高。

Hermes Agent 在这个问题上选择了正确的方向。

七、从 PM 视角：它给我的三个产品启发

写到这里，我想跳出用户视角，谈一些更产品层面的思考。

启发一：记忆系统是 AI 产品的基础设施，不是功能点

很多 AI 产品把”记忆”当作一个功能来开发——加个记忆开关，存几条用户偏好，显示在设置页面。这种理解方式太浅了。

Hermes Agent 的记忆系统是一个三层架构，有检索机制、有摘要压缩、有主动 nudge 逻辑、有用户建模。它是整个产品的底层基础设施。

在做 Vesper 的过程中，我们也在不断往这个方向迭代。AI 陪伴产品如果没有真正的记忆深度，就是一个会说话的 FAQ。

启发二：Skills 系统本质上是”程序化记忆”，是 AI 产品的飞轮

Hermes Agent 的 Skill 不只是宏，它是从经验中抽象出来的可执行程序。

这让我想到一个类比：一个优秀的 PM 助手，不只是记住你说过什么，而是学会了你处理问题的方式。这才是真正的”成长”。

Skills 系统带来的飞轮效应非常强：用得越多 → 生成越多 Skill → 处理效率越高 → 用得越频繁。这种正向循环，是很多 Agent 产品目前缺少的留存机制。

启发三：跨平台触达 × 持久化运行 = Agent 的下一个形态

我们现在习惯于用”打开 App”的方式使用 AI 工具。但 Hermes Agent 的形态是：AI 一直在那，你通过任何渠道找它。

这和我们理解”助手”的方式更一致——你不会每次需要助手的时候都重新激活他、重新介绍背景。你只需要发一条消息，他接着上次继续。

我认为这是 Agent 产品的下一个竞争维度：谁能做到真正的持久化存在感。

八、它目前的局限

写这篇文章不是为了做广告，所以局限也要讲清楚。

上手门槛不低。 安装和配置需要在终端操作，虽然有一键脚本，但对没有技术背景的用户不友好。它更适合开发者和有技术背景的 PM，普通用户暂时很难直接用。

Windows 不支持。 目前只支持 Linux、macOS、WSL2，对 Windows 用户不友好。

Skills 质量不稳定。 自动生成的 Skill 质量参差不齐，有时候会生成很冗余或者不够准确的 Skill，需要人工检查和修正。

多 Agent 协作还在早期。 子 Agent 功能虽然有，但复杂任务的调度和错误处理逻辑还不够完善，踩过几次坑。

九、它为什么值得关注

这个问题我最后回答。

Hermes Agent 不是功能最多的 Agent，也不是最容易上手的 Agent。但它在一件事上想得比别人更清楚：

AI Agent 的价值，不在于它调用了多少工具、接了多少平台，而在于它和用户的关系是否在随着时间变得更深、更有效。

从这个角度看，它构建的是一个关系型 AI 产品——每一次交互不只是完成任务，而是在加深它对你的理解，积累可复用的能力，形成越来越难以迁移的用户价值。

这个方向，我认为是对的。

而且，它是开源的，MIT 协议，GitHub 上公开全部代码。这意味着任何人都可以在这个基础上做二次开发、做商业化产品。

对于正在做 AI 产品的从业者来说，这不只是一个可以用的工具——它也是一个可以学习的产品样本。

最后说一句： AI 的竞争，已经从”谁的模型更聪明”，进入了”谁能让 Agent 真正陪着用户成长”的阶段。Hermes Agent 给出了它的答案。你的答案是什么？

本文由 @昀琪琪的AI世界原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自作者提供

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

昀琪琪的AI世界

专注AI人工智能｜分享有价值的内容

7篇作品 13598总阅读量

短视频版“美女与野兽”：有人月涨粉228万，反差越大越火

05-173746 浏览

如何由“点”到“面”破局运营增长？

04-257062 浏览

中文互联网青春流落“天涯”

05-016078 浏览

大厂都在砸钱的“即时零售”，只是外卖套了个新壳？

10-232864 浏览

非共识解读：大模型应用2C方向怎么做更有价值？

12-296544 浏览

目前还没评论，等你发挥！