智能体的知识库的三种数据格式

0 评论 1978 浏览 4 收藏 4 分钟
🔗 产品经理在不同的职业阶段,需要侧重不同的方面,从基础技能、业务深度、专业领域到战略规划和管理能力。

知识库通过存储、组织和检索知识,为智能体提供了强大的支持。本文详细介绍了智能体知识库的三种主要数据格式:结构化数据、半结构化数据和非结构化数据,供大家参考。

“知识库(Knowledge Base)是一个 存储、组织和检索知识 的系统化数据存储结构,支持 AI Agent 在特定场景下完成任务。它以多种数据格式存储知识,包括 结构化数据、半结构化数据与非结构化数据。”

知识库的核心目标是将外部知识转化为模型可调用的数据形式,便于智能体进行检索、匹配与推理,提高对复杂问题的理解与回答准确性。

01 结构化数据知识库

定义: 结构化数据以 表格、关系数据库(如 MySQL、PostgreSQL) 的形式存储,数据具有明确的 行列格式与字段定义,适用于 FAQ 问答系统、规则匹配 等场景。

应用场景:

  • 传统的 FAQ 问答系统
  • 产品参数匹配与查询
  • 多轮对话中信息槽位填充

示例:高校招生问答系统的结构化数据

02 半结构化数据

定义: 半结构化数据介于结构化和非结构化数据之间,通常以 JSON、XML 或 YAML 格式存储,数据字段不固定,适用于 动态知识调用与多模态数据解析 的场景。

应用场景:

  • 知识图谱构建
  • API 响应数据解析
  • 多维度数据检索

示例:智能客服知识库的半结构化数据

{  
“问题”: “如何退货?”,  
“答案”: {    
“退货流程”: [“申请退货”, “寄回商品”, “确认退款”],    
“退货期限”: “7 天无理由退货”  
},  
“分类”: “售后服务”
}

03 非结构化数据

定义: 非结构化数据包括 文本、音频、视频、图片等 无固定格式的数据形式,需要结合 NLP、OCR 等技术进行解析和检索。

应用场景:

  • 文档解析与问答
  • 视频内容摘要与知识提取
  • 图片 OCR 解析与内容标注

示例:企业内部政策文件的非结构化数据

“2024 年公司节假日安排:春节假期为 1 月 21 日至 1 月 27 日,其他法定节假日按照国家规定执行。”

本文由人人都是产品经理作者【是湘湘呀】,微信公众号:【数字化产品笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
35120人已学习13篇文章
有多少用户痛点,你是听回来的,而不是经过深思过后找出来的。
专题
126988人已学习33篇文章
小程序时代,产品经理和运营人员该如何拥抱这种变化?
专题
13107人已学习11篇文章
在工作中我们会跟客户/boss/用户等人对接需求,并把需求交付给设计师/开发等人,那么应该怎么做呢,本专题的文章分享了如何对接和交付需求。
专题
13011人已学习11篇文章
需求评审会议对整个项目想影响至关重要,作为产品经理,应该如何完成需求评审呢?本专题的文章分享了如何高效完成需求评审。
专题
34375人已学习17篇文章
让我们来扒一扒跨境电商的风险和机遇|从业者必看
专题
125742人已学习18篇文章
你说你会竞品分析,我信!但是肯定写的不好,不服看看别人的。