"Agent"相关的文章
AI
GAIA:AI Agent 的评估标准

GAIA:AI Agent 的评估标准

在智能体技术如火如荼发展的当下,我们急需一套能够衡量其“智力水平”的评估体系。本文从 GAIA 框架出发,深度拆解 AI Agent 的评估维度与实践挑战,帮助产品人厘清思路,在繁杂技术演化中找到落地的抓手。
AI,个人随笔
对谈 Pokee CEO 朱哲清:RL-native 的 Agent 系统应该长什么样?

对谈 Pokee CEO 朱哲清:RL-native 的 Agent 系统应该长什么样?

从简单的自动化任务到复杂的多步决策场景,Agent 的能力正在不断进化。然而,如何构建一个真正具备规划、执行和自我优化能力的通用智能体,依然是一个亟待解决的问题。本文通过与 Pokee CEO 朱哲清的深入对谈,探讨了基于强化学习(RL)的 Agent 系统的设计思路和未来发展方向。
透过史上最火WAIC 看Agent六大趋势

透过史上最火WAIC 看Agent六大趋势

WAIC 2025 把“Agent”从概念直接推到生产线:西门子机械臂听 Agent 指挥跳舞,MiniMax 30 分钟生成可玩小游戏,多智能体协作把会议纪要缩到分钟级,RaaS(结果即服务)取代炫技。六大趋势一句话——Agent 不再是大模型的玩具,而是正在接管 B 端产线、C 端桌面和整个云基建的“数字员工”。
AI
【AI研究】揭秘 SRPT:从零打造 AI Agent的方法论

【AI研究】揭秘 SRPT:从零打造 AI Agent的方法论

别再“拿着锤子找钉子”——作者用 SRPT 四步把 AI Agent 从玄学拉回人间:先锁定最小可落地场景,再代入角色深挖真问题,最后把任务拆成可执行、可回滚、可 AI 接棒的流程。文章用“估咕”股票估值 Agent 做案例,把“场景-角色-问题-任务”拆给你看,顺带给出任务复杂度×容错度、需求强度×发生频率两张图,一句话:会拆任务的大模型,才是真生产力。
AI
大厂「AI」智能体,等待 DeepSeek 时刻

大厂「AI」智能体,等待 DeepSeek 时刻

当 DeepSeek 缺席 WAIC,大厂们却用“智能体全家桶”填满舞台:腾讯一口气亮出 10 多款垂直 Agent,阿里把 20 万开发者做的 70 万个 Agent 摆成“镇馆之宝”,字节开源扣子平台三天破万星,百度则押注“多智能体协同+数字人直播”。流量格局未变,战场已转到 B 端场景落地——谁能先让 AI 从对话变“干活”,谁就抢到下一个 DeepSeek 时刻。
AI,个人随笔
为什么有AI Agent经验的产品经理更抢手?

为什么有AI Agent经验的产品经理更抢手?

这篇文章用 5 个切面拆解了“为什么有 AI Agent 经验的产品经理突然身价暴涨”:供需失衡只是表象,真正的稀缺在于他们能把模糊业务问题翻译成智能体目标,把一连串不确定的 LLM 调用变成可信、可用、可迭代的企业级能力。换句话说,他们不只是在做产品,而是在给 AI 同事定 KPI、搭班子和立规矩。