AI基础：LLM RAG Agents 是什么 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

AI基础：LLM RAG Agents 是什么

海鲜不设计

2026-01-15

0 评论 1120 浏览 2 收藏

9 分钟

当AI智能硬件成为新风口，理解LLM、RAG和Agents三大核心技术变得至关重要。LLM如同读过全书的超级大脑，RAG让模型实时获取外部知识，而Agents则像全能项目经理协调复杂任务。本文用通俗比喻解析这三者的核心差异与应用场景，为硬件产品经理提供清晰的技术选型框架。

最近开始做一些Ai智能硬件的工作，我相信各位同行基本也都是通过自学或者在项目中去慢慢积累经验，那么我也是，我现在想分享一点自己学习到的知识，一是为了加深自己对基础概念的认知，二是也想和大家一起共同进步。下面直接进入正题。

01 LLM是什么，它擅长做什么，它的短板是什么。

LLM通俗的来说就是大语言模型（英文全称：Large Language Model），你可以把它理解成“读过全世界大多数书和网站的超级大脑”–用文字说话的和思考的AI。

LLM是如何学会“懂人话”的呢：他的学习方式其实很简单粗爆-看海量的文本，学会“下一个词该是什么”。举个例子：“南京今天天很____”90%情况下，下一个词是“晴天”“暖”“冷”；它不是在理解天气，而是在统计“神祠最常跟在前面这些词后面。当这个预测能力强到极致时，就会出现神奇的事，他开始像是在“理解”“思考”“写作”。这就是涌现能力。

LLM的强项在于

1.通用知识：只要知识量足够，他可以从量子力学到怎么做红烧肉。他的知识存储在他的“大脑”（参数）里。

2.文本生成：不管是邮件、诗歌、代码，他都可以很好的胜任。

3、意图的理解：直白一点就是上下文理解，他可以听懂你的潜台词

比如你让他模仿鲁迅的文笔，写一段话。

4.最后则是多轮对话：这个很好理解，就是可以记住你之前的话，和你进行连贯聊天。

LLM短板或者不擅长的是什么呢

1.只是的保质期；他的知识来自于训练数据当前的时间节点，如果是24年的训练模型，你26年用，就会有些问题，他可能不知道26年发生的重大新闻。这就造成了一个很诡异的事情：他开始乱编，也就是一直说的幻觉，他会一本正经的胡说八道编一个新闻告诉你。

2.不理解你个人的或者相对垂直场景的SOP，比如你的私人日记是什么，你最新客户的报价单是什么。

那么既然LLM知识会过期，也不知道你的私密信息，那要怎么办呢，这个时候就会有一个技术手段进行解释—RAG（Retrieval-Augmented Generation检索增强生成）。

02 RAG 不是“知识”，也不是“模型”，而是一套“让模型用外部知识回答问题的系统架构”。

你可以理解成一个学生（LLM）正在参加一个开卷考试，你能用的就是你的大脑本身，但是因为是开卷考，所以考试规则是RAG；那么这个规则就允许你先去图书馆找资料（外部知识），把找到的相关的几页（上下文）拿回座位，并结合这些资料写出答案。

工作流简单来说：当你提问时，RAG 会先去你的“资料库”（比如公司文档、最新新闻网站、你的网盘）里快速检索，找到相关的信息，然后把这些信息连同你的问题一起交给 LLM，让它基于这些“新鲜资料”来回答

RAG适合什么场景：

1.知识更新快的-比如细嫩摘要、股市分析。实时的新闻昨天的模型肯定不知道，必须用RAG实时去查；

2.拥有私有知识库比如企业内部客服问订单状态，RAG去查数据库通过LLM把结果翻译成人话回复。

03 说完RAG再浅谈一下微调，微调其实就是特定风格/技能的场景，你可以把它理解是“专业的人”

微调其实相当于岗前培训或者特化教育；比如已经有一个训练好的模型，你需要他在某个领域更加专业，这个时候，你就可以继续投喂它某个专一领域的知识，强化它，让它变成这个专业里最厉害的人

那么微调在什么场景下最合适呢？

1.你需要特定的语气和风格：比如你说你需要一个像乔布斯一样的文案助手。这种“感觉”不是通过RAG实现的，而是通过微调决定的。

2.执行特定的复杂任务：同上理你需要对它进行特定专一的训练。

3.处理低频但关键的边缘情况：比如你希望模型永远不要回答某个敏感话题，就可以通过微调来实现。

04 那什么时候该上Agents

当你发现单单靠一个LLM已经无法满足需求来，这个时候就需要Agents来登场了。它相当于一个“全能项目经理”：它不仅有 LLM 这个“大脑”用来思考和决策，还有一堆“手脚”（工具/Tools）用来执行任务。

工作流程：

你给 Agents 一个大目标（比如：“帮我安排下周去北京的差旅”）。

1.大脑（LLM）思考：我需要先查机票，再订酒店，最后叫车。

2.调用工具（API/代码）：它调用携程的接口查机票，调用携程的接口订房，调用滴滴的接口叫车

3.反思与调整：如果发现没票了，它会自动调整方案，换一家航空公司。

什么时候必须用 Agents？

需要与外部系统交互：比如自动发邮件、操作数据库、控制智能家居。LLM 本身是封闭的，只有 Agents 能通过工具连接现实世界。

1.处理复杂、多步骤的任务：比如自动化科研。你让它“分析这个基因序列”，它会自己拆解步骤：先下载数据 -> 再用工具分析 -> 生成图表 -> 写成论文草稿

2.需要自主决策和反思：比如游戏 AI 或者自动化运维。遇到突发状况，它能自己判断是重启服务还是扩容，而不是傻等指令。

一句话总结：当你需要 AI “不仅动嘴，还要跑腿”，自动帮你完成一整套复杂的流程时，就上 Agents。

写在最后

AI的学习不是一蹴而就也不是走马观花的流于表面，这是我自己告诫自己的，必须要打好基础，为后面的深度探索打好基础。

本文由人人都是产品经理作者【海鲜不设计】，微信公众号：【设计噪点】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

海鲜不设计

理性至上，探索设计边界

34篇作品 190314总阅读量

打造爆款，做好“定位+场景营销”就够了

10-1610253 浏览

打造爆款，做好“定位+场景营销”就够了

Axure9：手风琴效果（动态面板）

08-243433 浏览

Axure9：手风琴效果（动态面板）

B端产品设计如何做到「情怀」与「效率」兼备？

04-195257 浏览

B端产品设计如何做到「情怀」与「效率」兼备？

基于“上瘾模型”【得物APP】的体验感受

08-037433 浏览

基于“上瘾模型”【得物APP】的体验感受

如何利用ChatGPT进行设计赋能（最全解析）

05-128467 浏览

如何利用ChatGPT进行设计赋能（最全解析）

评论

目前还没评论，等你发挥！