"Agent"相关的文章
AI,个人随笔
如何做Agent评测

如何做Agent评测

在大语言模型主导的AI时代,如何确保Agent应用层的稳定输出成为关键命题。本文系统拆解Agent评测体系的构建逻辑,从过程指标与结果指标的双重视角,揭示如何通过标准化测试收敛概率模型的不确定性。更包含评测集构建、自动化评测实施等实战方法论,为AI产品落地提供可复用的质量保障方案。
AI,个人随笔
Agent vs Workflow:谁才是效率革命的主角?

Agent vs Workflow:谁才是效率革命的主角?

随着AI和自动化技术的发展,企业和个人都在寻求提升效率的新方法。在这场效率革命中,“Agent(智能体)和Workflow(工作流)”是常常被提及的焦点。它们都旨在自动化任务、优化流程,但其本质、侧重点和适用场景却大不相同。它们各自代表了怎样的自动化范式?谁将成为驱动未来效率提升的主角?
AI,个人随笔
Agent技术选型的第一性原理(Workflow × Context)

Agent技术选型的第一性原理(Workflow × Context)

Agent技术正在重塑AI产品设计逻辑,但面对单体Agent、多智能体协作与Workflow的选择困境,产品经理如何精准决策?达摩院的Agent=Workflow+Context框架揭示了四种典型场景的技术选型秘籍,从死板流程的RPA应用到开放式创新的多Agent系统,本文将拆解不同确定性组合下的最优解法,助你避开过度智能的陷阱。
AI
最权威AI Agent避坑指南来了!智能体越多死得越快,效率最高暴跌70%

最权威AI Agent避坑指南来了!智能体越多死得越快,效率最高暴跌70%

Google DeepMind最新研究揭示:多智能体系统并非“越多越好”。盲目堆砌Agent数量不仅浪费算力,还可能损害性能。真正有效的关键在于“架构与任务匹配”:3–4个Agent是当前技术的黄金上限;单Agent准确率超45%时,组团反成负收益;工具密集或顺序依赖型任务尤其不适合多Agent。高效Agent系统应遵循三条铁律——控制工具复杂度、避免强基线下的冗余协作、设计验证瓶颈防错放大。少即是多,精准匹配胜过规模堆砌。
AI
PayPal黑帮成员下场重新创业:融资 2000 万美元,要用 AI Agent 干掉 Slack

PayPal黑帮成员下场重新创业:融资 2000 万美元,要用 AI Agent 干掉 Slack

Glue 的出现标志着团队协作正从“工具使用”迈向“AI Agent 共事”的范式革命。它以“线程为中心”的架构解决 Slack 式频道噪音问题,并将 AI 深度嵌入工作流——不再是独立聊天窗口,而是具备上下文感知、跨应用操作(通过 MCP 协议)和主动干预能力的虚拟队友。这不仅是界面优化,而是重构了知识流动、任务执行与组织协同的底层逻辑:未来的工作平台,是人类与 Agent 并肩作战的“胶水空间”。
脑子是个便宜货

脑子是个便宜货

GPT-5.2 的“妩媚”交互虽引发大众狂欢,但资本与风投 a16z 的目光早已转向更硬核的战场:SaaS 记录系统护城河崩塌、产品将为 AI Agent 而非人类设计、工厂与能源才是 AI 落地的真金矿。2026 年的商业逻辑已变——智能成白菜价,普通人红利在于“整合交付”标准化专业服务,而非贩卖技能或讨好眼球。
AI,个人随笔
AI PM 进阶笔记【2】:Agent-万字详解-含案例讲解(科普向)

AI PM 进阶笔记【2】:Agent-万字详解-含案例讲解(科普向)

2025年,AI将从‘会说话’进化到‘会干活’。AI智能体(AI Agent)不再是简单的聊天机器人,而是能够感知环境、规划任务、调用工具并主动推进目标的‘数字员工’。本文将系统性拆解AI智能体的完整知识体系,从核心认知架构到企业级落地细节,深入探讨规划算法、记忆系统和工具使用的关键技术,并展示如何在电商客服等高频场景中实现‘Agent+RAG+长期记忆’的落地流程。
豆包手机,玩脱了

豆包手机,玩脱了

豆包手机因采用GUI Agent技术实现跨应用自动化操作,引发微信、淘宝等超级App集体封杀。表面是权限之争,实则暴露了AI手机在隐私保护、系统透明度与行业规范上的深层缺失。真正的AI手机未来,需建立在开放标准与可信机制之上,而非仅靠用户授权单点突破。