Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”?
开源Agent框架Hermes正以惊人的速度抢夺OpenClaw的用户,但这场竞争背后隐藏着更深刻的产品哲学之争:Agent的能力究竟应该通过人工输入获得,还是让它自主学习成长?本文深入剖析了外挂式与内生式两种能力获取模型的优缺点,揭示了这个看似技术性的选择如何决定AI产品的未来走向。

年轻人终于有了第一个属于自己的爱马仕
最近一周,开发者社区里扎堆冒出”从 OpenClaw 迁移到 Hermes”的帖子。对比帖更是层出不穷——有人分析了 25 个讨论帖、1300 多条评论,结论是社区大概分成了四派,没有明确赢家。
GitHub 4.7 万星,v0.8.0 发布后单日新增 6400+ 星,连续多日全球开源榜第一。这个来自 Nous Research 的开源 Agent 框架,正以一种非常熟悉的节奏在抢 OpenClaw 的用户。
但我翻了一圈现有的文章,发现几乎所有人都在比功能列表——谁支持的渠道多、谁的记忆系统更强、谁的星标更高。这些当然有用,但作为产品经理,我觉得更值得关注的是另一个问题:
为什么两个做同一件事的 Agent 框架,在“Agent 怎么获得能力”这个问题上,走出了完全相反的两条路?
这个分歧,对所有在做 AI 产品的人来说,可能比任何一个具体功能都重要。
OpenClaw 装工具箱,Hermes 养新员工
先不做全面的功能对比,这类文章其实已经很多了。我只想聚焦一个维度:Agent 的能力到底是怎么来的?
OpenClaw 的回答很直接:人来给它装能力。社区写 Skill,用户挑 Skill,Agent 按照 Skill 里写好的流程执行。你想让它多会一样东西,就多装一个 Skill。它本质上是一个”工具+编排”的思路——Agent 本身不会变聪明,是人在帮它变聪明。
这条路走得很成功。OpenClaw 过去几个月建起了一个庞大的 Skill 生态,社区活跃度极高,新用户上手就有大量现成的 Skill 可以用。让它帮你管日程、发邮件、控制浏览器,找到对应的 Skill 配一下就行。
Hermes 的回答完全不同:让 Agent 自己学。
它有一套内置的学习机制。具体来说:Agent 完成一个复杂任务后,会自动评估这次执行值不值得记录——触发条件很明确,比如工具调用超 5 次、中途出过错然后自己修复了、用户做过纠正、或者走了一条不明显但有效的路径。满足任何一条,它就会自动生成一个 Skill 文件,记录名称、步骤、涉及的工具调用。
而且这个 Skill 不是一次写死的。Hermes 在后续执行中发现更好的路径,会用 patch 的方式局部修改,而不是整体重写,避免把原来好用的部分一起破坏掉。
说白了:OpenClaw 像一个超级工具箱,你往里面放越多工具它越好用;Hermes 像一个新员工,干的活越多越上手。
这不是在说谁好谁差。这是两种完全不同的产品哲学。
两种“能力获取模型”:外挂式 vs 内生式
如果把视角拉出 Hermes 和 OpenClaw 这个具体案例,你会发现这个分歧其实是所有 AI 产品都会面对的一个选择题。我把它总结为两种“能力获取模型”——外挂式和内生式。

外挂式能力获取,就是 OpenClaw 走的路线。核心逻辑是:产品的能力来自外部输入。人工编写知识、规则、流程,产品按照这些预设来执行。想要更多扩展能力,需要加更多插件、更多模板、更多配置项。
这种模式的好处很明显。可控性强,你知道产品能做什么、不能做什么,边界清晰。企业级治理方便,出了问题能追溯到具体哪个 Skill、哪条规则。生态一旦建起来,飞轮效应很强——社区贡献的 Skill 越多,新用户的上手体验越好,生态就越大。
但代价也很真实:复杂度随能力增长线性膨胀。当 Skill 数量从几十个涨到几百个,用户要从中选出适合自己的组合,本身就是一种认知负担。维护成本也会越来越高——OpenClaw 最近频繁更新导致兼容性问题,不少用户抱怨“每次升级都要修配置”,这不是偶然,而是外挂式模型的结构性代价。
内生式能力获取,就是 Hermes 走的路线。核心逻辑是:产品的能力来源于自身的使用过程。Agent 从实践中自动提炼经验,用得越多能力越强。
这种模式的好处在于个性化程度极高。每个用户的 Hermes 实例随着使用时间增长,会变成一个完全贴合自己工作方式的助手。而且长期使用的边际成本是递减的——它学到的东西越多,后续同类任务的完成效率越高。
代价同样真实:不可预测性高,能力边界模糊。你很难提前知道这个 Agent 在某个特定任务上的表现如何,因为它的能力取决于它过去的经验积累。
这两种模型不是 Hermes 和 OpenClaw 的专利。拉出来看,你会发现它们无处不在:
你做一个 AI 客服产品,是让运营团队手动维护知识库(外挂式),还是让系统从历史对话中自动学习最佳回复策略(内生式)?
你做一个 AI 写作助手,是提供更多模板和提示词库(外挂式),还是让它逐渐学习用户的写作风格和偏好(内生式)?
你做一个企业内部的 AI 工作流引擎,是让管理员预设好所有流程节点(外挂式),还是让系统观察员工的实际操作模式后自动优化流程(内生式)?
每一次这样的选择,都在决定你的产品往什么方向演化。
别被”越用越强”的叙事所迷惑
写到这里我必须说一句不太中听的话:Hermes 的“自进化”叙事确实很性感,但如果你把它当成 Agent 产品的最优解,可能会踩几个很深的坑。
第一个坑:自动生成的 Skill 质量谁来保证?
海外论坛上有一条高赞评论特别有意思。一个用户让 Hermes 从印第安纳州环保局网站抓取水质检测数据,结果数据被搅成一团,但 Agent 的自我评估结论是“干得漂亮”。这位用户的原话大意是:它总是觉得自己做得很好,每次都是。
这不是小 bug。这是内生式能力模型的结构性风险:如果 Agent 不能准确评估自己的输出质量,那它从”成功”任务中提炼的 Skill 可能是在把错误固化。人工写的 Skill 至少有人审核过,自动生成的 Skill 可能没人看过就进入了执行流程。
第二个坑:自动优化可能覆盖你的手动调教。
有用户反馈,他花了不少时间手动调教一个智能家居控制的 Skill,让它按照自己的偏好来工作。结果 Hermes 的“自动改进”机制在后续执行中把他的调整覆盖掉了。对那些花时间精心调教 Agent 的重度用户来说,这基本是劝退了。
第三个坑:“越用越强”的可解释性问题。
当一个 Agent 积累了几百个自动生成的 Skill 后,用户还能理解它为什么做出某个决策吗?在个人用途上无所谓,你觉得它好用就行。但在企业场景下,这几乎是致命的。一个不能解释自己行为的 Agent,在合规层面就过不了关。
第四个坑:冷启动问题。
OpenClaw 有庞大的社区 Skill 库,新用户上手第一天就能让 Agent 干活。Hermes 的能力需要“养”,前期体验必然弱于 OpenClaw。这就导致一个很现实的问题:用户有没有耐心等它“长大”?

所以我想说的是:内生式能力不是万精油。它用”可控性”换了”成长性”。这笔交易是否划算,完全取决于你的产品场景和用户画像。
你的 AI 产品该选哪条路?
聊了这么多,落到实际产品决策上,我觉得有几个判断标准可以参考。
看使用频率。内生式能力的前提是”积累”,如果你的用户每天都用、每周都用,那积累效应才有意义。如果你的产品是低频使用的(比如一个简历生成工具,用户可能一年用两次),内生式完全没有施展空间,老老实实用外挂式。
看场景标准化程度。越标准化的场景,外挂式越有效率。发票处理、合同审核、客服工单,这些场景的最优实践是相对固定的,让人总结一套最佳流程写成 Skill 就够了,不需要每个用户的 Agent 自己去摸索。反过来,越个性化的场景,内生式的价值才能体现出来。例如个人知识管理、创意写作辅助、个人工作流自动化。
你能接受多大的不可控性。ToB 产品,尤其是涉及关键业务流程的,几乎一定要选外挂式或外挂式为主。你不能跟客户说 “没事儿,它多用用就好了”。而 ToC 产品,则可以更大胆一些。
你的竞争壁垒想建在哪里。外挂式的壁垒在生态,谁的插件多、谁的模板好、谁的社区活跃。内生式的壁垒在数据飞轮,用户用得越久,迁移成本越高,因为他在别的产品上没有这些积累下来的个性化能力。

如果你让我下一个判断,我认为未来大概率是两种模式的融合。基础能力外挂式提供,解决冷启动问题,保证能力下限;个性化能力内生式积累,让产品随着使用时间越来越贴合用户,抬高能力上限。
其实 Hermes 自己也是这么做的,它虽然主打自动生成 Skill,但同样支持手动导入和编辑 Skill。OpenClaw 也有人在做自学习相关的 Skill 探索。纯粹的两极最终都会往中间走。
这场竞争真正有意思的地方
说回 Hermes 和 OpenClaw 的这场竞争。
坦白来说,从体量上看,现在说 Hermes 要取代 OpenClaw 还为时过早。OpenClaw 的星标数和用户基数还是大一个量级,生态成熟度也不在一个段位。而且海外社区里也不是一边倒——有大量用户指出 Hermes 社区可能存在刷量营销的嫌疑,不少推广帖的账号都是新注册的。这个真假暂且不论,但至少说明它的实际采用率可能没有 GitHub 星标和社交媒体讨论度看起来那么高。
另外还有一个变量得关注:Anthropic 收紧了第三方通过 Claude 订阅接入的通道,我过往视频也有有提到,甚至还趁机薅了一波小羊毛。但 OpenClaw 受到的冲击不小,部分用户正是因为这个原因开始考虑迁移。Hermes 目前还没有被波及,但如果它的用户量继续增长,同样的事情完全可能再发生一次。依赖单一模型提供商的平台风险,是所有 Agent 框架都绕不开的问题。
但这场竞争真正有意思的地方不在于谁赢谁输。它有意思的地方在于:这是第一次,Agent 社区开始认真讨论”Agent 应该怎么进化”这个问题。
以往我们讨论的 Agent,永远在讨论 “它能做什么”——能接几个渠道、能调几个工具、能处理多复杂的任务。现在开始讨论“它怎么变得能做更多”——是靠人喂,还是靠自己学?
这是一个质变。它意味着 Agent 产品的竞争维度正在从“功能丰富度”转向“能力增长方式”。对产品经理来说,这不只是一个技术选型问题,而是一个需要在产品设计最早期就想清楚的底层架构决策。
你的 Agent 产品,是工具箱,还是新员工?这个问题,值得在画第一版原型之前就想好。
本文由 @AI产品经理小田 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!

起点课堂会员权益




