在企业内部落地大模型效果好吗？——我们该怎么做

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

在企业内部落地大模型效果好吗？——我们该怎么做

shucay

2024-06-07

0 评论 3068 浏览 21 收藏

告别碎片化学习！通过“体系化知识输入+真实项目输出”的模式，帮你打下坚实的产品基本功，全方位提升你的核心竞争力，实现职业能力的跃迁。

大模型赛道现在发展如火如荼，但大家都是在卷价格，卷应用，关于场景的讨论较少。这篇文章，我们来看看大模型在行业内、企业内，正在发生的变化。

每一次新技术的到来，都引得各家蜂拥而上。大模型的热浪，烧到了全球每个角落。在底层大模型、及应用架构探索方面，美国遥遥领先。在应用层面上，中国会像互联网、移动互联网一样，取得百家争鸣甚至赶超欧美的盛况吗，大概率会，但尚需多少时日，暂不得而知。但有一点是明确的，敢于尝鲜的猎人，已经出发……下面就让我们来看看，在行业内、企业内，正在发生的变化。

一、生成式AI应用方向

生成式AI应用可以分为四大类，每个领域都在思考，这次变革对当下的工作、生活会带来什么样的变化，要怎么做才能登上“甲板”～

二、引入大模型，我们的工作会发生什么变化？

下面，用一张图推演下，当有了AI的协助，我们的工作状态会发生怎样的变化……

Copilot跟Agent的区别，笔者认为，copilot更多的依赖人类的大脑。Agent相比之下，有更高的自主性。所以，在“教-学”的环节，笔者用了Copilot这个词。

三、Agent架构为大模型加配了四件套

Agent（智能体）是一种能够感知环境、进行决策和执行动作的智能实体(感知、记忆、工具、行动)。不同于传统的人工智能，Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。在有LLM作为其大脑之后，Agent更是具备了对通用问题的自动化处理能力。

B端究竟需要什么样的产品经理？

B端产品经理都是以提升供应侧的工作效率为目的，所以B端需求主要是以业务问题为导向。这个是B端产品比较重要的一点，B端产品是服务于一个主体 ...

查看详情 >

Agent架构赋予大型语言模型（如 LLM）一种解决问题的“策略性思维结构”。该框架模拟了人类处理问题的过程，实现群体智能的模拟与构建，即“规划、执行及反馈的智能决策循环”。该架构可以用来搭建，第一章节中提及的生成式AI的四个演进方向，根据领域or场景的差异，有些做到copilot即可，有些需要达成agent，多agent，甚至是AIGC。自23年6月首次提出以来，已经有海量的资讯专门探讨、介绍AI Agent，在此不多着墨。

在该资料基础上扩充https://zhuanlan.zhihu.com/p/666913254

四、让大模型发挥作用，“模型”本身的能力、实现Agent的“架构”、“人”三者都很重要

LLM是集合了人类的智慧，通过自然语言交互可以给你答案，但是要想让这个“智脑”切实的帮助你，需要跟他交互的“人”的智慧，也需要“让大脑联合手脚(Agent)”的工程框架的能力。

4.1 如何高效、低成本的搭建Agent？

AI Agent是高度可训练的，像新员工入职时一样需要培训。需要从业务场景->Agent能力->平台功能->技术支持的一连串的推导，只有把SOP提炼、总结的足够精准和细致化，才更有利于one by one的去搭建、调优。

4.2 分析业务场景SOP定位需求为搭建Agent做好准备

以汽车销售场景为例，从最开始的了解到推荐，历经9个步骤。每个步骤中，都有关键用户行为合计22项。对各个营销触点，用户有各自的感受，有评价，有诉求(痛点)。对应的，企业内部对应的在这些环节上，形成了具体的需求，希望借助大模型的能力，可以为整体链路提效、提升用户体验和满意度。

引用自：神策数据出品的“汽车行业CJO解决方案”

4.3 应用场景->原子化->产品->技术能力->模型->服务

其一，抽象通用原子化能力，以复用，可以是agent，可以是插件，可以是信息库～。这些原子化的组件可以快速组装到业务所需要的大Agent中，类似N多个原子化的agent组成了MultiAgent。

其二，抽象特异性能力，以满足特殊业务场景需要

五、如何搭建Agent？

目前，比较敏捷的方式，是通过“智能体搭建平台”来实现。我们调研行业相关平台工具，整理如下：

5.1、海外AI Agent构建平台

5.2 国内AI Agent搭建平台

六、想落地效果好，还有很长的路要走

6.1、跟大模型的交互，给大模型投喂的“信息”很重要

大模型被认为可以达到本科毕业生同等的认知能力，因此，当大模型具备领域知识时，可以不依赖knowledge，可以从information到wisdom。大模型的推理能力很强，但推理的效果，要依赖“信息”。这好比大模型是土地，长出什么庄稼，要看喂给它的“种子”，“准确的、结构化的”信息or知识，便于让大模型懂。

数据加工成信息的途径：数据+定义和格式+时间范围和相关性=>信息
信息提炼成知识的途径：信息+假设+关系+模式和趋势=>知识
知识变成智慧的途径：知识+管理(收集、加工、应用、传播)+深刻认识(洞察、判断)+远见(预测)=>wisdom，越接近智能化，对物理世界的还原越接近“真相”

6.2 在安全的范围内使用、触碰“信息or知识”

大模型的能力，对信息的安全使用、合法“生成”、合规“触碰”提出了更高的要求。识别和拦截的维度可以有多种，可是模型粒度的、Agent粒度的，也可以是基础元素粒度的(插件、信息)，具体根据业务需要去设置。

6.3 怎么提问，有门道？

跟大模型的交互，一般是通过prompt工程来实现的，如何问，是非常重要的。行业内已经有很多关于如何写prompt工程的文章(角色扮演、零样本提示、少样本提示)，不再赘述。

这里，提醒应该充分发挥大模型的优势能力——COT（Chain of Thought）能力。即大模型在解决问题时能够展示其思考过程的能力。这种能力使得模型能够像人类一样，通过一系列逻辑推理步骤来解决复杂问题，而不仅仅是简单地输出一个答案。COT能够帮助人们理解模型是如何得出某个结论的，从而提高模型的透明度和可信度。

例如，假设我们要求大模型解决一个数学问题：

问题：一个直角三角形的两条直角边分别为3和4，求斜边的长度。

具有COT能力的大模型可能会这样展示其思考过程：

理解问题：首先，我需要理解这是一个关于直角三角形的问题，且已知两条直角边的长度。

应用知识：我知道根据勾股定理，直角三角形的斜边（c）的长度可以通过公式 𝑐=𝑎2+𝑏2c=a2+b2 来计算，其中a和b是两条直角边的长度。

代入数值：在这个例子中，a=3，b=4。所以我将这些数值代入公式中：𝑐=32+42c=32+42。

计算：计算各项的平方，得到 𝑐=9+16c=9+16。

求和：将平方相加，得到 𝑐=25c=25。

开方：计算平方根，得到 𝑐=5c=5。

得出结论：所以，这个直角三角形的斜边长度是5。

通过这种逐步展示思考过程的方式，COT能力不仅帮助用户理解模型是如何得出答案的，还可以在教育、解释复杂概念或决策过程时提供帮助。