AI基础:LLM RAG Agents 是什么

0 评论 428 浏览 0 收藏 9 分钟

当AI智能硬件成为新风口,理解LLM、RAG和Agents三大核心技术变得至关重要。LLM如同读过全书的超级大脑,RAG让模型实时获取外部知识,而Agents则像全能项目经理协调复杂任务。本文用通俗比喻解析这三者的核心差异与应用场景,为硬件产品经理提供清晰的技术选型框架。

最近开始做一些Ai智能硬件的工作,我相信各位同行基本也都是通过自学或者在项目中去慢慢积累经验,那么我也是,我现在想分享一点自己学习到的知识,一是为了加深自己对基础概念的认知,二是也想和大家一起共同进步。下面直接进入正题。

01 LLM是什么,它擅长做什么,它的短板是什么。

LLM通俗的来说就是大语言模型(英文全称:Large Language Model),你可以把它理解成“读过全世界大多数书和网站的超级大脑”–用文字说话的和思考的AI。

LLM是如何学会“懂人话”的呢:他的学习方式其实很简单粗爆-看海量的文本,学会“下一个词该是什么”。举个例子:“南京今天天很____”90%情况下,下一个词是“晴天”“暖”“冷”;它不是在理解天气,而是在统计“神祠最常跟在前面这些词后面。当这个预测能力强到极致时,就会出现神奇的事,他开始像是在“理解”“思考”“写作”。这就是涌现能力。

LLM的强项在于

1.通用知识:只要知识量足够,他可以从量子力学到怎么做红烧肉。他的知识存储在他的“大脑”(参数)里。

2.文本生成:不管是邮件、诗歌、代码,他都可以很好的胜任。

3、意图的理解:直白一点就是上下文理解,他可以听懂你的潜台词

比如你让他模仿鲁迅的文笔,写一段话。

4.最后则是多轮对话:这个很好理解,就是可以记住你之前的话,和你进行连贯聊天。

LLM短板或者不擅长的是什么呢

1.只是的保质期;他的知识来自于训练数据当前的时间节点,如果是24年的训练模型,你26年用,就会有些问题,他可能不知道26年发生的重大新闻。这就造成了一个很诡异的事情:他开始乱编,也就是一直说的幻觉,他会一本正经的胡说八道编一个新闻告诉你。

2.不理解你个人的或者相对垂直场景的SOP,比如你的私人日记是什么,你最新客户的报价单是什么。

那么既然LLM知识会过期,也不知道你的私密信息,那要怎么办呢,这个时候就会有一个技术手段进行解释—RAG(Retrieval-Augmented Generation检索增强生成)。

02 RAG 不是“知识”,也不是“模型”,而是一套“让模型用外部知识回答问题的系统架构”。

你可以理解成一个学生(LLM)正在参加一个开卷考试,你能用的就是你的大脑本身,但是因为是开卷考,所以考试规则是RAG;那么这个规则就允许你先去图书馆找资料(外部知识),把找到的相关的几页(上下文)拿回座位,并结合这些资料写出答案。

工作流简单来说:当你提问时,RAG 会先去你的“资料库”(比如公司文档、最新新闻网站、你的网盘)里快速检索,找到相关的信息,然后把这些信息连同你的问题一起交给 LLM,让它基于这些“新鲜资料”来回答

RAG适合什么场景:

1.知识更新快的-比如细嫩摘要、股市分析。实时的新闻昨天的模型肯定不知道,必须用RAG实时去查;

2.拥有私有知识库比如企业内部客服问订单状态,RAG去查数据库通过LLM把结果翻译成人话回复。

03 说完RAG再浅谈一下微调,微调其实就是特定风格/技能的场景,你可以把它理解是“专业的人”

微调其实相当于岗前培训或者特化教育;比如已经有一个训练好的模型,你需要他在某个领域更加专业,这个时候,你就可以继续投喂它某个专一领域的知识,强化它,让它变成这个专业里最厉害的人

那么微调在什么场景下最合适呢?

1.你需要特定的语气和风格:比如你说你需要一个像乔布斯一样的文案助手。这种“感觉”不是通过RAG实现的,而是通过微调决定的。

2.执行特定的复杂任务:同上理你需要对它进行特定专一的训练。

3.处理低频但关键的边缘情况:比如你希望模型永远不要回答某个敏感话题,就可以通过微调来实现。

04 那什么时候该上Agents

当你发现单单靠一个LLM已经无法满足需求来,这个时候就需要Agents来登场了。它相当于一个“全能项目经理”:它不仅有 LLM 这个“大脑”用来思考和决策,还有一堆“手脚”(工具/Tools)用来执行任务。

工作流程:

你给 Agents 一个大目标(比如:“帮我安排下周去北京的差旅”)。

1.大脑(LLM)思考: 我需要先查机票,再订酒店,最后叫车。

2.调用工具(API/代码): 它调用携程的接口查机票,调用携程的接口订房,调用滴滴的接口叫车

3.反思与调整: 如果发现没票了,它会自动调整方案,换一家航空公司。

什么时候必须用 Agents?

需要与外部系统交互: 比如自动发邮件、操作数据库、控制智能家居。LLM 本身是封闭的,只有 Agents 能通过工具连接现实世界。

1.处理复杂、多步骤的任务: 比如自动化科研。你让它“分析这个基因序列”,它会自己拆解步骤:先下载数据 -> 再用工具分析 -> 生成图表 -> 写成论文草稿

2.需要自主决策和反思: 比如游戏 AI 或者 自动化运维。遇到突发状况,它能自己判断是重启服务还是扩容,而不是傻等指令。

一句话总结: 当你需要 AI “不仅动嘴,还要跑腿”,自动帮你完成一整套复杂的流程时,就上 Agents。

写在最后

AI的学习不是一蹴而就也不是走马观花的流于表面,这是我自己告诫自己的,必须要打好基础,为后面的深度探索打好基础。

本文由人人都是产品经理作者【海鲜不设计】,微信公众号:【设计噪点】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!