AI用户体验要素二:那些无法忽略的UI交互行为

0 评论 200 浏览 0 收藏 10 分钟

AI时代正在重塑交互设计的底层逻辑,从传统GUI的树状操作到Agent协作的动态对话,用户体验迎来革命性转变。本文深度解析两种模式在任务流、信息呈现与决策效率上的本质差异,并揭示设计师如何构建新型'任务剧本',在空间映射、手势操作等关键领域实现人机协作的最优解。

从GUI到Agent协作,用户体验设计正经历一场范式转移。本系列分享将从八个核心维度,系统对比传统纯GUI交互与“自然语言+Agent协作”模式的差异,并探讨AI时代产品设计的新原则、新工具与新心智模型。

从“交互模型”落地到具体的“交互过程”,最直观的变化就是:用户与系统之间“回合”的性质,发生了根本改变

传统GUI交互:结构化的导航与操作

在传统GUI中,交互是树状的、结构化的,每个任务都被分解为一系列在界面层级中穿梭的固定步骤。

过程是预设的层级路径:例如想订电影票票,你必须遵循“首页 → 电影 tab → 选择影片 → 选择场次 → 选择座位 → 确认支付”这一严格顺序。系统是被动的,只响应用户在当前界面上明确的操作。

信息是推送给用户的:界面上会同时展示所有可用功能与信息(导航栏、推广位等)。用户必须主动分辨哪些是完成当前任务所需的,认知负荷极高。

Agent协作交互:非结构化的对话与动态澄清

而在Agent协作模式下,交互变成了线性的、对话式的,过程是动态的、充满澄清与确认的智能协作。

过程是动态的任务流:用户只需一个模糊指令,Agent会将其拆解为步骤并分步引导。这个流程是动态的,完全由你的意图驱动,Agent能在任务节点间智能跳跃。

信息是按需生成的:Agent只提供决策所需的最少关键信息,界面极度简洁。这种 “懒加载”式的信息呈现,能极大降低用户的认知负担。

决策模式的分水岭:从“二八原则”到“关键决策”

这种过程差异,催生了两种截然不同的决策模式:

GUI用户承受着“二八原则”的折磨——80%的时间在寻找入口、关闭弹窗等操作上,只有20%的时间在真正做决策。

Agent协作:Agent能过滤掉所有无意义的操作,将交互过程提炼为一连串的“关键决策”。用户的精力被完全集中在需要人来做判断、做选择的环节上。

这个提炼过程在技术上,常通过Agent的思维链展现。背后的流程是:Agent收到模糊指令后,先自行推理拆解任务(查询场次、获取座位图等),然后定位需要用户决策的关键节点,生成对应界面请求确认,待用户答复后再继续推进任务。

设计师的新命题

这种从“结构化导航”到“非结构化对话”的转变,给你的产品设计工作带来了新命题。核心工作不再是设计固定的界面跳转流,而是去设计一套灵活的“任务剧本”:

定义任务蓝图:为复杂任务,定义Agent的逻辑流程。比如在支付前,必须插入一个“二次确认”的检查点。

设计决策节点:识别出哪些是必须由用户决策的“关键瞬间”(如选座),并确定该调用什么组件来承载。

管理上下文:思考Agent应记住哪些信息。例如,当用户付款时说“用上次那张卡”,Agent需要能理解其所指。

简单来说,设计交互过程,从穷举所有页面和跳转关系,变成了在关键决策点之间,设计智能的对话引导逻辑。Agent承载了所有无意义的“操作”,让用户得以回归到任务的核心——做出选择。

为什么有些GUI还无法省略

越来越多人聊到CLI等相关概念,很多人都有一种似乎GUI可以完全省略的思考中,但是在笔者看来,随着技术的迭代发展或许会有这么一天,但是至少现阶段有很多GUI交互是无法被忽视的。

物理世界映射:空间感知决定了GUI的不可替代性

当决策依赖二维或三维空间内的相对位置关系时,人类的视觉-空间智能远超语言。

电影院选座:用户关心的不仅是距离远近,还有“是否在正中间”、“与已售座位的距离”。语言无法高效描述,必须依赖SeatMap组件。

距离与位置感知:选酒店时,说“我要离西湖近的”是模糊意图,Agent可通过地图组件高亮距离,让用户直观对比后,进行点击选择

图像或模型操作:在医学影像上圈出病灶,或在设计稿中圈出待修改区域,语言无法完成精准的空间定位,必须保留图片编辑组件。

设计原则:凡是决策涉及“哪里”(对特定空间位置的直观判断),就必须保留相应的GUI组件。Agent的作用不是替代这个GUI,而是把后台数据和智能筛选的结果,通过数据绑定注入组件,让用户的判断更高效。

操作行为:从“规则化的点击流”到“保留非结构化手势”

在行为层面,可以被AI预测并自动执行的步骤将被省略,但依赖人类精细操作的非结构化手势,不仅需要保留,还承担着更深层的交互责任。

结构化操作 (可预测的点击)

这类“A到B到C”的固定点击流,本质上是一种规则。Agent最擅长的就是学习并跳过这些中间步骤,用对话、卡片选择或自动执行来替代。

案例:“帮我把这个文档最后一页的表格复制到邮件里。”Agent可以后台执行一系列操作,直接呈现最终预览,省去了所有切换、复制、粘贴的过程。

非结构化操作 (需保留的物理手势)

拖动、涂抹、旋转这类连续、模拟态的手势,对应着人最本能的交互,AI难以预测其精确结果。

案例

音量/亮度滑块:需要感受那个恰好的“度”。

视频剪辑时间轴:需要精细地左右拖动来定位帧。

修图滤镜强度:需要看着图片变化,来回滑动滑块直到满意。

游戏操作:摇杆、划屏等,是体验本身,完全不可被替代。

我们作为产品设计师该如何判断?

语言过滤:这个交互传递的意图,能否用一句话清晰表达?(是 → 省略GUI,转为对话)

空间依赖:这个决策是否需要用户对空间位置做出直观判断?(是 → 必须保留GUI,如SeatMap)

手势依赖:这个操作是否需要连续、非离散的物理手势来完成?(是 → 必须保留GUI,并提供良好的操作体验)

情绪/审美判断:这个决策是否纯主观?(是 → 保留GUI,让用户直接与内容互动,而非让AI替代判断)

最终,Agent协作下的“交互过程”,不再是“从A页面点选到B页面”的穷举,而是变成了一连串在关键决策点之间,由AI驱动的“交互接力”:AI完成可结构化的步骤,然后将那些需要人类直觉、情感和空间判断的环节,以最纯粹的GUI形式,交还到用户手中。

本文由 @热心网友小陈 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!