垂直Agent该如何做?红杉宠儿Harvey:OpenAI投资的法律AI成独角兽了…

0 评论 1554 浏览 1 收藏 12 分钟

Harvey,这款由红杉加持、OpenAI投资的法律AI,不仅以惊人的融资节奏跃升为独角兽,更在产品结构、数据闭环与行业深度上树立了垂类智能体的新标杆。本文将以Harvey为样本,深入解析垂直Agent的构建逻辑与商业潜力,为你揭示下一代AI产品的破局之道。

前两天介绍了医疗AI中的明星产品OpenEvidence,其实当时被红杉吹捧的不只是他,还有个法律Agent产品Harvey:

如果打开这个产品,再结合OpenEvidence的实现路径,大家可能就会发现数字分身类AI项目很多共同的特点了。

Harvey AI 创始人是一对KnowHow + 技术的经典组合,由行业专家(律师)以及AI技术专家组成,旨在打造专为法律专业服务智能体平台。与OpenEvidence一致,他们也成立于2022年,属于ChatGPT第一批受益者。

市场方面对其前景高度认可:

  • 2023年12月B轮融资8000万美元,估值7.15亿美元;
  • 2024年7月C轮融资1亿美元,估值15亿美元;
  • 2025年2月D轮融资3亿美元,估值30亿美元;
  • 2025年6月E轮融资3亿美元,估值50亿美元;

可以看到,比之OpenEvidence的60亿估值,Harvey是不遑多让,截至2025年第三季度,他们已经实现了数千万美元收入。

进一步,他存在的意义也很简单,就是降本增效。法律行业文书量巨大且高度专业,律师需花费大量时间在审查合同、法律检索和文书起草上等工作上。

Harvey AI诞生的核心原因是解决现有大模型在法律专业场景中的不足,尤其是“幻觉”问题。其实对于数字分身AI来说,来源可靠、可追溯几乎是通用要求了。

实现路径方面也是老三样,通过构建专门的法律知识库,使得AI回答附带完整来源引用,极大提高了答案可信度。

最后,专业的法律人员总是稀缺,Harvey的出现也迎合了市场之于降本增效的需求,所以越来越多的客户和企业要求律师使用AI工具。

接下来,我们来看看具体的产品结构:

一、产品功能

Harvey的产品由多个协同模块构成,其中包括法律助手、文件仓库、知识检索和工作流等核心功能:

法律助手提供对话式界面,可在Word、Outlook等应用内询问法律问题、起草文件或分析案件事实,这是属于标准的基于知识库的AI“文书”生成功能;

文件仓库允许批量导入大量文件,自动提取关键条款并进行集中式审查;

知识检索模块支持用户针对复杂法律、监管、税务问题进行深入检索,自动返回带有出处引用的答案,涵盖全球法规、案例和业内最佳实践;

工作流模块则是一套可视化的自动化流水线设计工具,律师可无需编程知识即可串联多个AI任务,如自动翻译、信息提取、批量起草…

例如,用户可以设计一个“合同尽职调查”工作流,由Harvey自动依次提取合同要点、核对标准条款并生成报告;也可使用Harvey预置的NDA审核工作流,大幅缩短了初始审查时间;

Harvey还与微软Office 365深度集成:在Word中嵌入了Harvey的AI撰写和检查插件,在Outlook中可快速生成或回复邮件,并能将SharePoint中的历史文件同步至Harvey环境进行查找。

这里我知道大家理解得懵懵懂懂的,这里需要举个例子:

二、法律版Coze

Harvey 在产品模块设计上与国内Coze 有不少相似之处,但又更贴合法律行业的需求。最大不同来源于两点:它内置了大量法律知识库、使用了训练的法律模型。

所以,他所谓端到端的低代码工作流构建环境,满足律师事务所定制化的业务流程需求。其实是因为他是一个法律行业专属的智能体平台:既有 Coze 式的可视化工作流机制,又有很多法律插件,还利用专业法律语料和规则大幅降低了常见的“幻觉”风险。

所以,这东西跟之前的OpenEvidence还真的有所不同,OpenEvidence更加2C一点,Harvey 貌似企图让各个律师上传自己的工作流与数据?

就如业界观点,在企业级市场上,垂直领域的智能体OS(如法律行业的 Harvey)更能听懂行业语言、理解真实需求:

懂行的同学都知道,工作流平台这东西不重要(工作流重要),所以Harvey 最有特色的部分是其知识库模块,整个系统设计围绕法律场景展开。Harvey 的法律研究功能能够检索并分析法律内容,本身就是非常好的知识库应用,甚至可以单拎出来使用。

比如,当律师在系统中询问复杂的法规问题时,Harvey 会返回包含完整出处链接的答案。当知识不足时,可以由文件仓库模块补足文件,由此建立私人法律知识库。

再匹配其专有训练过的大模型,于是产品专业度会提升不少,只不过我这里其实有些质疑其是不是仅仅是早期训练过模型,因为现阶段其实是不太训练的了。

综上,虽然在功能上可能与Coze、Dify类似,但从定位上Harvey属于法律助手类协同平台,具体来说差异体现在数据,这里有很多是Dify这类平台做不到的,比如:

三、生态情况

Harvey 与 LexisNexis 宣布战略联盟,把 初级法 直接集成到 Harvey 里,用于检索与可验证引用,规避“爬网页”式来源;

同时,Harvey 有可能是OpenAI早期的数据供应商,他早期与OpenAI、PwC等合作,开发了针对美国案例法的专用模型,在GPT-4之上注入了十亿级别的法院判决文本,显著提高了复杂法律问题的准确性。

简单来说,Harvey是一家在法律领域相当有底蕴的团队,比如他们和微软办公体系结合得很深,很多客户选择Harvey除了因为其高度定制化的法律大模型、结果的可验证性;然后就是他可以与现有办公系统的无缝集成…

所以,Harvey是吃了渠道流量的红利啊,这也体现出了其巨大的生态优势。

再者,因为其2B工作台的特性,商业模式其实也比较固定,无非是订阅费乃至为大客户定制模型和工作流的工程服务费。

只不过,随着用户量增加,其可以完成的撮合交易特性也在体现,活脱脱有将自身变成法律品类某个流量撮合平台的趋势:与律所合作开发的工作流(如A&O Shearman的ContractMatrix、Macfarlanes的Amplify)对外商业化,律所和Harvey按比例分享收益。

最后,我们聊聊国内对标:

四、国内情况

国内的话,也不是没有法律相关的产品,比如:AlphaGPT、法狗狗、契约锁等,完成功能也很常见,包括同审查、法律文书起草、法律咨询、案卷阅读、案情分析等。只不过DeepSeek尤其是R1这东西的幻觉率,懂的都懂。

而且简单看看其融资情况:iCourt AlphaGPT 没找到融资数据;法狗狗最近的融资要到2017年的数千万了;契约锁也要到2021年,数字未知;好一点的是幂律智能,做合同AI/法律AI的,23年融资近8000w;

我们只从资本层面来说很难产生直接的对标产品,因为法律场景不像医疗那么“有钱”(百川智能还是花了不少钱),而且只要占领入口广告都可以赚很多(比如百度)…

综上,国内尚无产品能在功能深度与数据基础上完全匹配Harvey。

其背后原因,我觉得核心还是在于数据,但并不是数据难以获取的问题,其实数据安全这块走展空间很大,只不过症结点可能在于标注难度高!

并且就我去年接触下来,法律这个行业还很传统,他们很多数据依旧本地化Word、PDF、邮件飞来飞去,并没有太好的意识要做规整;

然后就要从更深层的人性角度思考了,比如为什么我们有点小病痛喜欢先到线上去问问AI医生,为什么我们几乎不倾向于问AI律师?会不会其本身有什么问题?

五、结语

回到我们最初的问题:为什么 OpenEvidence 与 Harvey 会成为“垂直智能体 OS”的代表?

医疗与法律看似不同,但底层逻辑很类似,把“确定性”用工程方式固化出来,再让模型在边界内发挥推理能力。

所以答案是:强来源的数据证据 + 可复用的工作流标准件 + 面向可交付结果的评估方法学。其关键在于三个工程化闭环:数据闭环:摒弃全网爬取,构建“私域知识-公共证据-上下文治理”的可追溯体系,让每个结论都有据可查。工作流闭环:将复杂任务拆解为30-50个“可交付单元”,目的依旧是可控性。评估闭环:用“完成度/可交付度”取代虚高的“准确率”;

最后,对中国市场而言,法律AI爆款产品要出现,其难点不在数据匮乏,而在“数据是否可用、可评、可控”。散落的Word/PDF、薄弱的知识结构、严格的安全顾虑等等都是我们接下来要攻克的…

本文由人人都是产品经理作者【叶小钗】,微信公众号:【叶小钗】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!