每天学一点AI知识:智能体(Agent)解决问题的流程
智能体(Agent)如何像人类一样思考并完成任务?本文揭秘智能体工作流程五步法,从任务明确到环境扫描,再到思考规划与执行动作,最后通过观察迭代实现闭环。深入解析每个步骤的核心机制与技术实现,助你理解AI智能体的运作原理与能力边界。

前文介绍过智能体的核心架构有3大部分(不包含部署和安全等部分):模型、工具、编排层。

基于之前介绍的内容,结合笔者看过不少资料以及工作经验,分享智能体(Agent)的工作方法和步骤,总结为“智能体工作流程五步法”。

步骤 1:明确任务(Get the Mission)
明确任务是指智能体会根据用户的指令先做语义理解和意图识别等工作,推理出需要做的任务。
如:安排团队成员的差旅行程。
步骤 2:环境扫描(Scan the Scene)
环境扫描是指:智能体需要查询上下文窗口(context)中的历史对话信息,然后结合任务进行推理,将历史对话中的与此任务相关的信息摘录出来,如目的地、参与人员、时间等;
并且查询可以调用的工具(tools),如日历、第三方航班信息、日程软件API等。
工具(tools)中会包含:名称、所需参数、工具描述(可以实现的任务范围)。智能体查询工具时可以根据工具描述过滤出可以辅助完成目标的工具。
步骤 3:思考规划(Think It Through)
思考规划是智能体的核心,由推理模型驱动。
智能体结合任务(步骤 1)和环境信息(步骤 2)制定计划,启动一连串推理。
比如:
智能体结合“安排差旅行程”的任务,规划:1.先了解团队成员名单(调用 get_team_roster 工具查询到),2.通过 calendar_api 查询他们的可用时间,3.根据时间、人数去查询航班信息,4.最终给出一个行程规划清单。
步骤 4:执行动作(Take Action)
在编排层(笔者的其他文档有相关介绍)Agent构建出第3步中的规划;
开始执行规划的首个具体步骤,选择并调用相应工具——调用 API、运行代码函数或查询数据库。
再根据下一步骤持续的推进实际行动。
步骤 5:观察迭代(Observe and Iterate)
智能体观察动作执行结果(如 get_team_roster 工具返回 5 人名单),将新信息添加到上下文或“记忆”中,然后循环返回步骤 3:“现在已有成员名单,下一步通过 calendar_api 查询这 5 人的日程。”
通过循环执行并且持续“观察迭代”,实现上下内容不缺失,尽量避免凤头鸡尾、逐渐跑题等逻辑混乱的情况。
需要说明的是:由于大模型算力和记忆能力(上下文窗口存储能力等)的限制,部分Agent在执行超过它记忆能力的任务时,会出现做了下面忘记上面的情况。
就像是大家看书看到第四章,忘记第一章在讲什么一样~
详细原因推荐大家去读《思考快与慢》这本书,据说大佬们在设计AI的时候有参考这本书中关于人类大脑的记忆方式。
所以智能体的任务完成能力是有上限的,并不是能完整完成所有任务,需要根据具体使用场景评估Agent的执行情况。
在实际项目中,要设计好兜底方案,并提前和用户传达此类风险。
本文由@宇智波冰 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unspalsh, 基于CC0协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




