3A 分诊法:哪些交给 Automation,哪些做 Augmentation,哪些丢给 Agent

0 评论 412 浏览 0 收藏 13 分钟

AI协同工作的边界究竟在哪里?3A分诊法将任务精准划分为Automation、Augmentation、Agent三个层级,帮你解决何时该放手、何时该掌控的难题。本文深度解析如何根据确定性、可逆性、任务跨度动态调整AI参与度,让你的决策力始终用在刀刃上。

把”写周报”交给一个全自动 Agent,你会收获一篇语法正确、事实无误、但没有一个人想读的废话。

把”这个需求到底要不要做”交给全自动,你会被它那种不容置疑的自信坑得很惨。它会用同样笃定的语气支持你做,也支持你不做。

问题从来不是”AI 能不能做这件事”。

能。问题是这件事,你该让 AI 站在你前面、站在你旁边、还是替你把整条路走完。

这三个位置,对应三种协同模式。

我把它叫 3A 分诊:Automation、Augmentation、Agent。

每接到一个新任务,先把它扔进这三个抽屉里的一个。这个动作熟练了之后,三十秒就能决定,省得你每次都凭感觉乱试。

三层到底差在哪

先把定义掰清楚,因为很多人是混着用的。

Automation,自动化。AI 独立完成一个确定性任务,你不用盯,结果好验证。

格式转换、数据清洗、把一堆日报汇总成周报模板,这类活儿规则清楚、对错分明,交给它你拿结果就行。

Augmentation,增强。AI 给你信息、给你建议,但拍板的是人。它

帮你把五份调研摘要好,把利弊列出来,但”做不做”这个决定还在你手里。AI 在这一层是你的参谋,不是你的替身。

Agent,智能体。AI 自主规划并执行一串多步任务,你只负责设边界。

比如”帮我把这个竞品调研做完并出一版对比报告”,它自己拆步骤、调工具、一步步走,你管的是它能动到哪、不能碰什么。

这不是我拍脑袋分的。学术界有个 A²C 框架,正好就是这三级:automation、augmentation、collaboration。斯坦福 SALT Lab 还做了个更细的东西叫 Human Agency Scale,人类能动性量表,用五个级别来刻画一件任务里人到底该保留多少话语权。所以”该让 AI 多自主”本身就是个可以分级的滑块,不是开关。

举个我自己上周的例子,把三层放在同一件事上你就分得清了。我要发一封产品更新邮件给一批老用户。

这件事拆开看是三段:把上个月的更新日志整理成几条人话,这段规则清楚、对错好验,Automation,我让 AI 直接出;这封邮件的语气该热情还是克制、该不该提那个还在灰度的功能,这段是判断,Augmentation,AI 给我两个版本的建议,我拍板;真正点”发送”那一下、决定发给哪个用户分组,这段一旦错了几千人就收到了,不可逆,我自己来,AI 碰都不让它碰。同一封邮件,三段活儿分属三个抽屉。

你要是图省事把整件事一股脑丢给一个全自动 Agent,它大概率会用一封措辞得体、却把灰度功能也写进去的邮件,把你坑得明明白白。

分诊维度一:确定性

第一个问题:这件事的规则有多确定,输出好不好验证?

越确定、越好验证,就越往 Automation 推。

格式转换这种事,输入输出关系是死的,对就是对,错一眼能看出来,那还盯着它干嘛,自动化掉。

反过来,一件事如果连”什么叫做对了”你自己都说不清,那它根本不该进 Automation 这个抽屉,AI 自动做完你也不知道该信不信。

分诊维度二:后果的可逆性

第二个问题:万一做错了,能不能撤回来?

后果越不可逆、风险越高,就越要留在 Augmentation,人保留决策权。

发出去就收不回的邮件、一旦定了就要全公司执行的需求优先级,这类事 AI 可以给你列得明明白白,但最后那一下,必须是你按。

斯坦福那个研究里有个挺有意思的发现:工人们对”自动化”的渴望度,在不同任务上差得非常远。他们巴不得自动化掉的,是那些低价值、重复、烦人的体力活;他们坚决想自己留着的,是高判断、高情感投入的部分。

这其实就是人的直觉在做分诊:把可逆的、低判断的推出去,把不可逆的、要担责的攥在手里。这个直觉是对的。

分诊维度三:任务的跨度

第三个问题:这件事要走几步、调几个工具、链条有多长?

只有那种需要跨多步、调多个工具、长链条编排的活,才值得动用 Agent。

Agent 的价值就在长程任务的编排上,它能把”调研、整理、生成、再核对”这一串自己串起来跑。但反过来,链条越长,错误累积得越凶。

第一步偏一点,到第五步可能就跑到南辕北辙去了。

所以上 Agent 的同时,必须配”人设边界”:明确告诉它哪些是红线、哪些情况必须停下来问你。

3A 和你的工作 OS 怎么咬合

3A 最容易被误解成”三选一,给每个任务定终身”。

不是。一个任务在它的生命周期里,是会升舱和降舱的。

一个新任务,你对 AI 在这上面靠不靠谱心里没底,那就先从 Augmentation 起步。

你盯着,它给建议,你拍板。跑了几轮,发现它在这类活上稳得很,错误率极低,那就降舱到 Automation,撒手让它自己干。

或者反过来,发现这事其实是个能交给它端到端跑的长链条,那就升舱到 Agent。

先小范围动手,试出信任,再调整放权的程度。

分诊不是一次性的判决,是个动态的过程。

升舱和降舱靠什么触发,我自己有个土办法:盯错误率。

同一类任务连着跑十几次,我心里记个账,它错了几次、错的是大错还是小疵。要是连着两周稳得很,那这事就该往 Automation 降舱,我不再逐次审了,改成抽检;要是它老在某个固定环节翻车,那它还没资格升舱,得继续留在 Augmentation 里我盯着。

这个账不用很精确,就是个手感。关键是别凭一两次的好印象就贸然放权。AI 有种本事,是头三次表现惊艳,第四次给你来个低级错误,你要是头三次就撒手了,第四次的雷就是用户替你踩。放权的节奏,得由它的稳定性说了算,不是由你的乐观说了算。

但是,别把抽屉钉死

三分法有个天然的麻烦,叫分类摩擦。现实里的任务常常跨界,一件事一半像 Augmentation 一半像 Automation,你硬要塞进一个抽屉会别扭。

更要命的是,模型能力每个月都在变。

今天这件事你判它该 Augmentation,是因为现在的模型还信不过;三个月后模型迭代两版,同一件事可能就能稳稳 Automation 了。

如果你半年前贴的标签一直不动,你就是在用过时的判断浪费当下的能力。

所以分诊法是动态的,得定期重判。别把抽屉钉死。

我现在的习惯,是每隔一两个月把那张”任务-A标签”的表拿出来重扫一遍,专门找那些还压在 Augmentation 上、我却已经记不清上次让它出错是什么时候的任务。

这种就是典型的”标签滞后”:模型早就能稳稳办好,是我对它的信任没跟上,还在用半年前的判断浪费它今天的能力。把这种任务挑出来降舱到 Automation,我每周能省下实打实的几个小时。

反过来也有降级的,有些任务我半年前判它能 Automation,后来业务复杂了、边界变模糊了,它开始偶尔出错,那就得老老实实把它升回 Augmentation,重新盯着。

重判不是走过场,它直接对应你每周的时间账。

分诊不只决定怎么用 AI,也决定你练什么

3A 还有一层很少被提的用处:它顺手帮你想清楚,自己的精力该往哪儿投。

把你的任务分完诊你会发现一个规律——能稳稳进 Automation 的那些活,正是未来最不值得你亲手练的技能。

格式转换、数据整理、套模板写初稿,这些事 AI 只会越来越强,你练得再熟也跑不过它,更别提它能并行、能不眠不休。而那些你死活攥在手里、坚决不肯交出去的活,高判断、高情感、要担责的决策,恰恰是你最该往深里练的地方,因为那是 AI 短期内接不走、也是你的不可替代性所在。

所以分诊表还能当一张”技能投资地图”读:往 Automation 那头沉的,是你该交出去、不必再苦练的;往 Agent 和 Augmentation 这头浮的,尤其是那些只有你拍得了板的判断,才是你该花十年功夫去磨的。

很多人焦虑 AI 会取代自己,却把劲儿使反了——拼命去练那些注定被自动化掉的执行技能,反而荒废了那些 AI 抢不走的判断力。分诊分得清楚,这账你就算得明白。

给你一个本周的动作:把你这周最耗时的 10 个任务列出来,每个贴一个 A 标签——Automation、Augmentation 还是 Agent。然后看分布。

如果你发现 80% 都压在 Augmentation 上,那答案很清楚:你还没敢真正放手,大量本该自动化掉的活,你还在亲自盯着。

分诊不是为了让 AI 多干活,是为了让你把判断力,花在只有你能判断的地方。

好的分诊,是让 AI 站在它该站的位置——不抢你的方向盘,也别只当个不会说话的仪表盘。

本文由 @巫师Sorcerer 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!