第41页 | Agent | 人人都是产品经理

AI

GAIA：AI Agent 的评估标准

在智能体技术如火如荼发展的当下，我们急需一套能够衡量其“智力水平”的评估体系。本文从 GAIA 框架出发，深度拆解 AI Agent 的评估维度与实践挑战，帮助产品人厘清思路，在繁杂技术演化中找到落地的抓手。

张艾拉

Agent AI产品 GAIA

AI,个人随笔

抢先体验GenFlow2.0：未来多Agent协作的理想形态

在 AI 浪潮席卷各行业的当下，一款名为 Genflow 2.0 的通用 Agent 产品悄然崭露头角。它能否打破中文语境下的应用瓶颈，为用户带来全新体验？让我们一同深入探索。

Super黄

Agent AI产品产品分析

AI,个人随笔

对谈 Pokee CEO 朱哲清：RL-native 的 Agent 系统应该长什么样？

从简单的自动化任务到复杂的多步决策场景，Agent 的能力正在不断进化。然而，如何构建一个真正具备规划、执行和自我优化能力的通用智能体，依然是一个亟待解决的问题。本文通过与 Pokee CEO 朱哲清的深入对谈，探讨了基于强化学习（RL）的 Agent 系统的设计思路和未来发展方向。

海外独角兽

Agent AI应用个人观点

AI,个人随笔

从零学习大模型（13）——RAG 与 Agent 进阶：基于 LangChain 的落地实践与框架解析

大模型落地到底难在哪？ RAG与Agent虽火，但如何从概念走向实战，真正用得好、用得巧？本文围绕 LangChain 的核心能力展开，从底层原理到项目拆解，带你理解每一步如何协同：如何构建对话式Agent、如何组织调用链路、如何实现多模态交互……

金融产品小兵

Agent RAG 大模型

透过史上最火WAIC 看Agent六大趋势

WAIC 2025 把“Agent”从概念直接推到生产线：西门子机械臂听 Agent 指挥跳舞，MiniMax 30 分钟生成可玩小游戏，多智能体协作把会议纪要缩到分钟级，RaaS（结果即服务）取代炫技。六大趋势一句话——Agent 不再是大模型的玩具，而是正在接管 B 端产线、C 端桌面和整个云基建的“数字员工”。

IT时报

Agent WAIC 六大趋势

AI

【AI研究】揭秘 SRPT：从零打造 AI Agent的方法论

别再“拿着锤子找钉子”——作者用 SRPT 四步把 AI Agent 从玄学拉回人间：先锁定最小可落地场景，再代入角色深挖真问题，最后把任务拆成可执行、可回滚、可 AI 接棒的流程。文章用“估咕”股票估值 Agent 做案例，把“场景-角色-问题-任务”拆给你看，顺带给出任务复杂度×容错度、需求强度×发生频率两张图，一句话：会拆任务的大模型，才是真生产力。

seven777

Agent AI应用 SRPT

AI

大厂「AI」智能体，等待 DeepSeek 时刻

当 DeepSeek 缺席 WAIC，大厂们却用“智能体全家桶”填满舞台：腾讯一口气亮出 10 多款垂直 Agent，阿里把 20 万开发者做的 70 万个 Agent 摆成“镇馆之宝”，字节开源扣子平台三天破万星，百度则押注“多智能体协同+数字人直播”。流量格局未变，战场已转到 B 端场景落地——谁能先让 AI 从对话变“干活”，谁就抢到下一个 DeepSeek 时刻。

蓝洞商业

Agent DeepSeek 智能体

AI,个人随笔

全球最赚钱20家AI Agent公司出炉！最高爆赚5亿美元，两个趋势值得关注

首份全球AI Agent赚钱榜揭晓：Cursor以5亿美元年收领跑，20强里过半公司用不到一年就把ARR冲到千万级，人均创收最高320万美元。两大信号已清晰——“垂直场景+高客单价”正批量复制独角兽，AI Agent正把传统SaaS的利润模型直接打穿。

硅基观察Pro

Agent 创业公司商业模式

AI,个人随笔

为什么有AI Agent经验的产品经理更抢手？

这篇文章用 5 个切面拆解了“为什么有 AI Agent 经验的产品经理突然身价暴涨”：供需失衡只是表象，真正的稀缺在于他们能把模糊业务问题翻译成智能体目标，把一连串不确定的 LLM 调用变成可信、可用、可迭代的企业级能力。换句话说，他们不只是在做产品，而是在给 AI 同事定 KPI、搭班子和立规矩。