Hermes 和 OpenClaw 之争，Agent 的能力应该“装上去”还是“长出来”？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Hermes 和 OpenClaw 之争，Agent 的能力应该“装上去”还是“长出来”？

AI产品经理小田

2026-04-12

0 评论 412 浏览 0 收藏

16 分钟

开源Agent框架Hermes正以惊人的速度抢夺OpenClaw的用户，但这场竞争背后隐藏着更深刻的产品哲学之争：Agent的能力究竟应该通过人工输入获得，还是让它自主学习成长？本文深入剖析了外挂式与内生式两种能力获取模型的优缺点，揭示了这个看似技术性的选择如何决定AI产品的未来走向。

年轻人终于有了第一个属于自己的爱马仕

最近一周，开发者社区里扎堆冒出”从 OpenClaw 迁移到 Hermes”的帖子。对比帖更是层出不穷——有人分析了 25 个讨论帖、1300 多条评论，结论是社区大概分成了四派，没有明确赢家。

GitHub 4.7 万星，v0.8.0 发布后单日新增 6400+ 星，连续多日全球开源榜第一。这个来自 Nous Research 的开源 Agent 框架，正以一种非常熟悉的节奏在抢 OpenClaw 的用户。

但我翻了一圈现有的文章，发现几乎所有人都在比功能列表——谁支持的渠道多、谁的记忆系统更强、谁的星标更高。这些当然有用，但作为产品经理，我觉得更值得关注的是另一个问题：

为什么两个做同一件事的 Agent 框架，在“Agent 怎么获得能力”这个问题上，走出了完全相反的两条路？

这个分歧，对所有在做 AI 产品的人来说，可能比任何一个具体功能都重要。

OpenClaw 装工具箱，Hermes 养新员工

先不做全面的功能对比，这类文章其实已经很多了。我只想聚焦一个维度：Agent 的能力到底是怎么来的？

OpenClaw 的回答很直接：人来给它装能力。社区写 Skill，用户挑 Skill，Agent 按照 Skill 里写好的流程执行。你想让它多会一样东西，就多装一个 Skill。它本质上是一个”工具+编排”的思路——Agent 本身不会变聪明，是人在帮它变聪明。

这条路走得很成功。OpenClaw 过去几个月建起了一个庞大的 Skill 生态，社区活跃度极高，新用户上手就有大量现成的 Skill 可以用。让它帮你管日程、发邮件、控制浏览器，找到对应的 Skill 配一下就行。

Hermes 的回答完全不同：让 Agent 自己学。

它有一套内置的学习机制。具体来说：Agent 完成一个复杂任务后，会自动评估这次执行值不值得记录——触发条件很明确，比如工具调用超 5 次、中途出过错然后自己修复了、用户做过纠正、或者走了一条不明显但有效的路径。满足任何一条，它就会自动生成一个 Skill 文件，记录名称、步骤、涉及的工具调用。

而且这个 Skill 不是一次写死的。Hermes 在后续执行中发现更好的路径，会用 patch 的方式局部修改，而不是整体重写，避免把原来好用的部分一起破坏掉。

说白了：OpenClaw 像一个超级工具箱，你往里面放越多工具它越好用；Hermes 像一个新员工，干的活越多越上手。

这不是在说谁好谁差。这是两种完全不同的产品哲学。

两种“能力获取模型”：外挂式 vs 内生式

如果把视角拉出 Hermes 和 OpenClaw 这个具体案例，你会发现这个分歧其实是所有 AI 产品都会面对的一个选择题。我把它总结为两种“能力获取模型”——外挂式和内生式。

外挂式能力获取，就是 OpenClaw 走的路线。核心逻辑是：产品的能力来自外部输入。人工编写知识、规则、流程，产品按照这些预设来执行。想要更多扩展能力，需要加更多插件、更多模板、更多配置项。

这种模式的好处很明显。可控性强，你知道产品能做什么、不能做什么，边界清晰。企业级治理方便，出了问题能追溯到具体哪个 Skill、哪条规则。生态一旦建起来，飞轮效应很强——社区贡献的 Skill 越多，新用户的上手体验越好，生态就越大。

但代价也很真实：复杂度随能力增长线性膨胀。当 Skill 数量从几十个涨到几百个，用户要从中选出适合自己的组合，本身就是一种认知负担。维护成本也会越来越高——OpenClaw 最近频繁更新导致兼容性问题，不少用户抱怨“每次升级都要修配置”，这不是偶然，而是外挂式模型的结构性代价。

内生式能力获取，就是 Hermes 走的路线。核心逻辑是：产品的能力来源于自身的使用过程。Agent 从实践中自动提炼经验，用得越多能力越强。

这种模式的好处在于个性化程度极高。每个用户的 Hermes 实例随着使用时间增长，会变成一个完全贴合自己工作方式的助手。而且长期使用的边际成本是递减的——它学到的东西越多，后续同类任务的完成效率越高。

代价同样真实：不可预测性高，能力边界模糊。你很难提前知道这个 Agent 在某个特定任务上的表现如何，因为它的能力取决于它过去的经验积累。

这两种模型不是 Hermes 和 OpenClaw 的专利。拉出来看，你会发现它们无处不在：

你做一个 AI 客服产品，是让运营团队手动维护知识库（外挂式），还是让系统从历史对话中自动学习最佳回复策略（内生式）？

你做一个 AI 写作助手，是提供更多模板和提示词库（外挂式），还是让它逐渐学习用户的写作风格和偏好（内生式）？

你做一个企业内部的 AI 工作流引擎，是让管理员预设好所有流程节点（外挂式），还是让系统观察员工的实际操作模式后自动优化流程（内生式）？

每一次这样的选择，都在决定你的产品往什么方向演化。

别被”越用越强”的叙事所迷惑

写到这里我必须说一句不太中听的话：Hermes 的“自进化”叙事确实很性感，但如果你把它当成 Agent 产品的最优解，可能会踩几个很深的坑。

第一个坑：自动生成的 Skill 质量谁来保证？

海外论坛上有一条高赞评论特别有意思。一个用户让 Hermes 从印第安纳州环保局网站抓取水质检测数据，结果数据被搅成一团，但 Agent 的自我评估结论是“干得漂亮”。这位用户的原话大意是：它总是觉得自己做得很好，每次都是。

这不是小 bug。这是内生式能力模型的结构性风险：如果 Agent 不能准确评估自己的输出质量，那它从”成功”任务中提炼的 Skill 可能是在把错误固化。人工写的 Skill 至少有人审核过，自动生成的 Skill 可能没人看过就进入了执行流程。

第二个坑：自动优化可能覆盖你的手动调教。

有用户反馈，他花了不少时间手动调教一个智能家居控制的 Skill，让它按照自己的偏好来工作。结果 Hermes 的“自动改进”机制在后续执行中把他的调整覆盖掉了。对那些花时间精心调教 Agent 的重度用户来说，这基本是劝退了。

第三个坑：“越用越强”的可解释性问题。

当一个 Agent 积累了几百个自动生成的 Skill 后，用户还能理解它为什么做出某个决策吗？在个人用途上无所谓，你觉得它好用就行。但在企业场景下，这几乎是致命的。一个不能解释自己行为的 Agent，在合规层面就过不了关。

第四个坑：冷启动问题。

OpenClaw 有庞大的社区 Skill 库，新用户上手第一天就能让 Agent 干活。Hermes 的能力需要“养”，前期体验必然弱于 OpenClaw。这就导致一个很现实的问题：用户有没有耐心等它“长大”？

所以我想说的是：内生式能力不是万精油。它用”可控性”换了”成长性”。这笔交易是否划算，完全取决于你的产品场景和用户画像。

你的 AI 产品该选哪条路？

聊了这么多，落到实际产品决策上，我觉得有几个判断标准可以参考。

看使用频率。内生式能力的前提是”积累”，如果你的用户每天都用、每周都用，那积累效应才有意义。如果你的产品是低频使用的（比如一个简历生成工具，用户可能一年用两次），内生式完全没有施展空间，老老实实用外挂式。

看场景标准化程度。越标准化的场景，外挂式越有效率。发票处理、合同审核、客服工单，这些场景的最优实践是相对固定的，让人总结一套最佳流程写成 Skill 就够了，不需要每个用户的 Agent 自己去摸索。反过来，越个性化的场景，内生式的价值才能体现出来。例如个人知识管理、创意写作辅助、个人工作流自动化。

你能接受多大的不可控性。ToB 产品，尤其是涉及关键业务流程的，几乎一定要选外挂式或外挂式为主。你不能跟客户说 “没事儿，它多用用就好了”。而 ToC 产品，则可以更大胆一些。

你的竞争壁垒想建在哪里。外挂式的壁垒在生态，谁的插件多、谁的模板好、谁的社区活跃。内生式的壁垒在数据飞轮，用户用得越久，迁移成本越高，因为他在别的产品上没有这些积累下来的个性化能力。

如果你让我下一个判断，我认为未来大概率是两种模式的融合。基础能力外挂式提供，解决冷启动问题，保证能力下限；个性化能力内生式积累，让产品随着使用时间越来越贴合用户，抬高能力上限。

其实 Hermes 自己也是这么做的，它虽然主打自动生成 Skill，但同样支持手动导入和编辑 Skill。OpenClaw 也有人在做自学习相关的 Skill 探索。纯粹的两极最终都会往中间走。

这场竞争真正有意思的地方

说回 Hermes 和 OpenClaw 的这场竞争。

坦白来说，从体量上看，现在说 Hermes 要取代 OpenClaw 还为时过早。OpenClaw 的星标数和用户基数还是大一个量级，生态成熟度也不在一个段位。而且海外社区里也不是一边倒——有大量用户指出 Hermes 社区可能存在刷量营销的嫌疑，不少推广帖的账号都是新注册的。这个真假暂且不论，但至少说明它的实际采用率可能没有 GitHub 星标和社交媒体讨论度看起来那么高。

另外还有一个变量得关注：Anthropic 收紧了第三方通过 Claude 订阅接入的通道，我过往视频也有有提到，甚至还趁机薅了一波小羊毛。但 OpenClaw 受到的冲击不小，部分用户正是因为这个原因开始考虑迁移。Hermes 目前还没有被波及，但如果它的用户量继续增长，同样的事情完全可能再发生一次。依赖单一模型提供商的平台风险，是所有 Agent 框架都绕不开的问题。

但这场竞争真正有意思的地方不在于谁赢谁输。它有意思的地方在于：这是第一次，Agent 社区开始认真讨论”Agent 应该怎么进化”这个问题。

以往我们讨论的 Agent，永远在讨论 “它能做什么”——能接几个渠道、能调几个工具、能处理多复杂的任务。现在开始讨论“它怎么变得能做更多”——是靠人喂，还是靠自己学？

这是一个质变。它意味着 Agent 产品的竞争维度正在从“功能丰富度”转向“能力增长方式”。对产品经理来说，这不只是一个技术选型问题，而是一个需要在产品设计最早期就想清楚的底层架构决策。

你的 Agent 产品，是工具箱，还是新员工？这个问题，值得在画第一版原型之前就想好。

本文由 @AI产品经理小田原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App