从样板到生产,企业知识库分阶段治理方法论

3 评论 163 浏览 0 收藏 18 分钟

企业知识治理从样板间走向规模化生产的过程中,火山引擎团队提出的十万级文档处理难题暴露出传统方法的边界。本文深度剖析知识库建设从人工精修到规则提炼的三大阶段跃迁,揭示企业级知识管理如何通过准入机制、版本识别和可信度分层实现质的突破。

前几天和字节火山引擎团队开了个会,和他们交流了一些企业 AI 落地的思路和方法,也是希望双方之后能围绕企业 AI 项目形成更紧密的合作。

我在会上介绍了过去做知识治理、知识库建设和智能体落地的经验,包括资料怎么收集分类、文档怎么修改分片、评测集怎么做、上线后怎么验收、以及客户不配合时怎么推动。

整体流程和实施路径对方是认可的,也看得出我们在知识体系建设上很有经验,但聊到一个问题时,我却突然卡壳了。他们问:

“看起来你之前交付的项目,主要是在POC和样板阶段,要处理的知识文档数量最多几百份。但如果客户拿出来的资料是上万份,甚至十几万份文档,这种超大规模的知识文档该怎么治理?”

确实,尽管我做过不少知识类项目,对看资料、给整改建议、做评测集、推动业务部门改文档的过程很熟。但几十份、几百份资料可以这么做,就算到了千级,只要抽样、分类和评测配合得好,也还能推进。

但十几万份文档呢?还能指望顾问一份份打开看吗?

这个问题让我陷入了沉思——企业知识治理从样板走向生产环境后,实施方案上要做出什么调整?

个人知识库VS企业知识库

说起搭知识库,很多人第一时间想到的,可能是被无数自媒体推荐过的卡帕西的那套个人知识库管理方法。

大概思路是:把文章、论文、网页、笔记这些原始资料放到一个本地目录里,再让 LLM 把这些资料整理成一个结构化的 Wiki,最后用 Obsidian 来浏览、链接和维护。用得好一点,还可以结合 Claude Code、Obsidian 的知识库 Skill,把新增资料自动整理进现有的知识体系里,再让AI自动更新知识库结构。

这个思路对个人很有启发。

一个人做研究、写文章、整理项目资料,几十份、几百份文档,用这套方法已经能解决不少问题。因为个人知识库的使用者和维护者通常是同一个人。资料放在哪里,哪些可信,哪些只是临时记录,自己心里大概有数。回答就算有偏差,也能自己纠回来。

而企业知识库的复杂度,可远不止这个层面。

企业的资料通常不是一个人攒出来的。制度在 OA,流程在飞书,产品资料在网盘,历史项目材料在不同部门,培训课件可能是 PPT,业务数据还在 ERP、CRM、MES 这些系统里。更麻烦的是,每份资料背后还有部门、权限、版本、责任人、适用范围和业务场景。

如果只是个人知识库,文档多一点,最多是检索结果乱一点。但企业知识库一旦召回了旧版的制度,给出已经过期的口径,甚至是非正式材料,影响的可是客服、销售、法务、运营、财务这些真实工作。出了问题,谁来承担这个后果?

所以,企业知识治理,一定不能照搬个人知识库的思路。

个人知识库处理的是个人知识复用。企业知识库处理的是组织里的知识秩序。

企业知识库治理的三个阶段

知识治理在企业里,大致会经历三个阶段。

第一个阶段,是手工精修的样板阶段

企业刚开始做 AI 知识类项目时,通常不会一上来全公司铺开。比较稳妥的方式,是先选一个部门、找一个典型业务场景,再拿一批代表性资料出来,把第一个样板间跑通。

这个阶段的资料量通常不大。几十份,或者上百份。想一炮打响,人工介入就很有必要。

因为企业最开始拿出来的资料,通常都不是为 AI 准备的,它们是给人看的。人能看懂一页 PPT 里图和文字的关系,能理解一个表格里的合并单元格,能知道某个内部缩写是什么意思,也能判断一份老文档是不是还在用。

AI 可不懂这些背景。

所以早期治理要做得很细。PPT 图文混排严重,就要判断是不是要把它重写成Word格式,分段讲清楚文字和图片的关系。表格结构太复杂,就要看能不能拆成更清楚的字段和说明,只保留一层表头和一一对应的行列数据。制度文件有多个版本,就要找客户确认到底以哪一版为准。销售话术、客服问答、培训材料,如果没有明确问题和答案,也要考虑是否拆成 FAQ 或标准条目。

这些都是细活儿,要一篇一篇看,一条一条梳理问题,最终形成整改报告,虽然很辛苦,但它决定第一个样板能不能成功跑出来。

早期客户看的不是技术架构多完整,而是一个真实场景能不能用。能不能查到准确制度?能不能回答业务问题?能不能减少员工反复问人的时间,让业务部门觉得能切实减轻他们的工作负担。

样板阶段,手工精修的价值就在这里。

但这套方法的边界也很明显:如果项目从一个场景扩大到多个部门,资料从上百份变成上千份,还能一份份精修吗?如果每个部门都等着顾问逐条看、逐条改,项目周期会被拖成什么样?

到了这个阶段,治理方式必须换。

第二个阶段,是规则抽查的扩展阶段

千级文档还可以人工介入,但人工不能再承担全部细节。

这时候更合理的做法,是按:文档类型、业务部门、知识场景去抽样。

制度类的 Word/PDF 最容易评估,因为企业通常会对这类文档有着严格的格式要求,这时只需抽几篇会被高频提及的制度,重点看标题层级、版本号、适用范围是否明确,看图片是否有文字描述,看附件是否可描述,看印章水印是否单独解析即可。PPT 类材料,则重点看图文混排是否影响切片内容。表格类资料,需要注意字段、口径、上下文是否完整。FAQ 类内容,重点看问题和答案是否对应,答案有没有过期,是否存在多种口径。

抽查的目的,是找到共性问题。

比如抽了十份培训 PPT,发现大部分内容都依赖图示和现场讲解,但解析后同一个主题被分配到了多个切片中,导致上下文断裂,那就不能只改其中一份,要把这类 PPT 当成一类共性问题,统一要求改写成文档版,或者单独整理成问答条目。

再比如评测时发现流程类问题经常答错,就要去看资料里有没有明确流程,流程图有没有文字说明,旧版流程是否还在库里,问题问法是否落在系统能识别的范围内。

项目做大以后,单个 badcase 的价值有限,真正有价值的是把问题分类,观察出现回答失误的原因,是资料缺失、版本冲突、分片不合理、召回参数错误,还是业务问题本身没定义清楚导致意图未覆盖?

只有把问题归到类型上,后面才能批量整改。

这个阶段的核心工作,是要把顾问的个人经验,整理成“知识治理规则”,把工作拆给客户,让客户知道怎么自查,怎么整改,怎么判断资料是否合格。否则项目一扩大,就会从专业服务变成体力消耗。

当然,规则出来了,其中相对固定、判断逻辑客观可验证的那一类,也就可以交给AI帮我们初筛,这时就要进入第三阶段。

第三个阶段,是机器辅助治理的生产阶段

当文档量级进入万级,甚至十几万份,第一步就肯定不能是全量直接导入。

企业经常会有一个错觉:资料越多,AI 应该越聪明。

现实情况可没这么简单。

资料越多,就越会带来大量的重复资料、新旧混合的资料,口径相互冲突的资料,以及大量中间态的临时资料。把这些东西全部放进系统,系统会变聪明吗?当然不会。

  • 如果一份新版制度和一份旧版制度同时存在,AI 该用哪一份?
  • 如果一个产品说明在销售部、客服部、培训部各有一个版本,系统该以哪一份为准?
  • 如果一份会议纪要里记录了某个临时讨论结论,它能不能作为正式回答依据?
  • 如果十年前的工程文档还在库里,它是知识资产,还是检索噪音?

这些问题不先处理,你的文档越多,系统就越不稳定。

所以大规模知识治理的第一步,是做减法。企业要先判断,哪些资料有资格被检索,哪些资料只能归档,哪些资料需要人工确认后再入库,哪些资料应该直接剔除。

这里需要设计一道资料准入机制,先处理几个基础问题。

第一,去重。

企业历史资料里,同一份文档可能被复制、改名、转存很多次。文件名不同,内容高度相似。如果不去重,后面检索时就会召回一堆重复内容,既浪费算力,也干扰判断。

第二,识别版本。

知识文档不是静态的。制度会修订、手册会更新、流程也会调整。有些变化很小,只改了一个词,但业务意义已经变了。尤其是合规、法务、财务、风控场景,旧版本误用的风险很高。

第三,做相似聚类。

把主题相近、内容相近、场景相近的资料放在一起看,才能发现冲突。单看一份文档,可能觉得都对;放在一起看,就会发现同一个问题有三种说法。

第四,给文档画像。

一份文档至少要知道几个信息:它是什么类型,来自哪个部门,适用于什么场景,什么时候生效,谁负责维护,哪些人可以看,能不能作为正式回答依据。没有这些信息,系统即使能检索,也不知道该怎么用。

第五,判断来源可信度。

对外公开的正式制度、对内使用的业务手册、员工的培训课件、各种会议纪要、个人经验分享稿,这些肯定不能放在同一个可信度层级里。正式制度可以作为答案依据,培训课件可能只能作为辅助解释,会议纪要很多时候只能保留为背景材料。

第六,判断使用价值。

有些资料有归档价值,但没有问答价值。有些历史材料对复盘有用,但不适合进入前台回答。有些过程文档可以保留在后台,但无需被普通用户直接检索到。

这6个问题,都是准入机制要解决的,它负责回答:“什么资料值得放入知识库”的问题。

做完这些你会发现,企业知识治理真正进入生产阶段后,决策质量会比导入速度更重要。

我的反思

过去我做知识治理,确实大量依赖个人经验。看一份文档,大概能判断它适不适合进库;看一组评测结果,能判断问题出在文档、分片、召回参数、提示词,还是业务口径;跟业务部门聊几轮,就知道哪些边界没说清楚。

但项目规模一上来,只靠经验就明显不够了。

企业需要的,是可复制的规则。

  • 比如文档抽检规则。不同类型的文档怎么抽,抽多少,看哪些问题,问题怎么记录。
  • 比如文档准入规则。哪些资料可以直接导入知识库,哪些资料需先整改,哪些只能归档,哪些建议删除。
  • 比如评测归因规则。回答失败后,怎么判断是资料缺失、旧版本干扰、召回错误、权限问题,还是用户问题本身不清楚。
  • 再比如文档整改规则。发现某一类 PPT 解析异常,怎么改成易于解析的文档格式,怎么推动同类资料统一处理,而不是每次都靠单个 case 临时修。
  • 还有知识责任规则、版本判断规则、标签归类规则等等。

这些规则不沉淀下来,就算顾问再专业,也容易被大量细节吞噬掉。项目越大,就越像一个没有尽头的资料整理任务。

而规则提炼的过程,不也正是当下最流行的一种AI应用场景:自我蒸馏么?😂

总结

做了那么多知识治理项目,站在第一性原理的角度看,最后要解决的,就是几个最朴素的问题:

  • 这份资料是谁的?
  • 它还有效吗?
  • 它和其他资料冲突吗?
  • 它能不能被机器稳定理解?
  • 它有没有资格作为答案依据?
  • 如果回答错了,谁来修?

这些问题不解决,AI 应用做得再漂亮,也很难进入企业真实生产环境。

当然,解决的过程,也不是一蹴而就。

  • 样板阶段,可以靠人工精修跑通一个场景。
  • 扩展阶段,则是靠规则抽查,把经验复制到多个部门。
  • 生产阶段,需要依赖准入机制和机器辅助治理,处理万级以上规模的资料。

企业要做的,是在不同阶段用不同治理方法,把知识从可用、可管,最终推向可规模化。

企业知识治理的本质,就是建立一套入口机制。它决定哪些资料能进系统,按什么规则进,进入后由谁维护,出现问题怎么回溯。

早期靠样板建立信心。走到后面,则要靠一套能让知识持续可信、可控、可更新的治理规则来支撑规模。

希望这篇思考对你有所帮助。

本文由人人都是产品经理作者【申悦】,微信公众号:【互联网悦读笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 客服场景里,如果同时存在产品部写的功能手册和运营部整理的常见问题,准入机制需要优先收录手册,因为手册的权威性和稳定性更高,FAQ 更适合作为辅助材料。

    来自广东 回复
  2. 样板间靠手工精修能跑通,但推广时规则提炼的速度往往跟不上业务扩张的速度。关键在于把个人经验沉淀为可复用的规则,否则顾问容易被细节吞噬,项目变成无尽的体力活。

    来自广东 回复
  3. 企业知识库不能照搬个人知识库的玩法,核心是要建立治理规则:从手工精修的样板间,到规则抽查的扩展期,最后靠准入机制和机器辅助处理万级文档。资料准入要先做减法,去重、识别版本、判断可信度,否则文档越多系统越不稳定。

    来自广东 回复