产品经理的胡言乱语:写在AI带来的交互模式变革前夜

ka
0 评论 738 浏览 1 收藏 10 分钟

在科技的迅速发展下,我们的交互模式、甚至未来的信息分发模式可能都将迎来巨大的变化。这篇文章里,作者就阐述了他的感想,一起来看。

当计算机操作系统从DOS(磁盘操作系统)到图形用户界面(GUI)时,人类拖动着光标双击图标打开文件时带来多少震撼已经不可考,但是却真实的塑造了我们已知的世界。

而今,我们又站在了一个新时代的前夜。但任何变革真正显示出排山倒海的气势前,其中发展的草灰蛇线往往不被人重视,当时只道是寻常,如果非要给这个开始的开始,提供一些注脚,那可能大家需要关注几个科技动态:

  1. vision pro带来的更成熟的自然交互模式探索;
  2. GPT-4o 带来的更成熟的多模态交互能力;
  3. 以Diaspora等为代表的社交服务商带来的基于区块链技术的去中心化的信息分发模式发展。

当我们尝试理解一个信息系统的运行逻辑时,我们都可以抽象出这样一个模型:

输入 – 处理 – 输出

当前主流的交互模式主要包括基于图形用户界面(GUI)的交互方式,用户通过鼠标、键盘、触摸屏等传统输入设备与计算机系统进行互动,系统获取信息后,通过对应的驱动程序,负责将硬件生成的电信号转换为操作系统能够理解的输入事件。

我们更像一个机器的操作工,汗流浃背的在多个APP中切换,使用APP预设的方式录入信息,获取有限的功能。我们被系统驯化了,所谓的学习成本,不过是因为系统本身交互模式和信息处理方式局限造成的约束,是系统和人之间的巴别塔。但这不是终点。

我们期望可以像和人一样和系统交互,由此引发了对自然交互模式(Natural Interaction)的期盼,用以减少用户学习和适应新技术的负担,提高用户体验和效率。曾经这个想法多么遥不可及,但是现在来看,未来已来:

  • 苹果所演示的Vision Pro,支持语音+手势+面部/眼动追踪,实现可见即可交互。VR和AR技术通过创建沉浸式环境,使用户可以以自然的方式获取更丰富的信息细节。它解决了输入和输出阶段的问题。
  • GPT-4o 支持多模态交互能力,为新一代的交互模式解决了后端信息处理的难题。一段文本承载的信息量是完全低于一段语音,一段语音承载的信息量完全低于面对面的交谈。手势、微表情、语音、语调、音量、语速、停顿、重音,未来甚至交谈人的温度和气味,意味着大模型可以获取更多的信息以辅助其更准确的理解问题,缩短其推理的时间,并支持提供更高质量的回答。

所以,我们无法再将大语言模型当成一种智能的对话机器人,未来将出现一个以大语言模型为信息组织基底,以混合显示为信息展示载体的自然交互模式,它将是新一代操作系统的雏形,它的最终形态一定不是现有图形界面操作系统的附庸,而是颠覆者。

可能这么想比较抽象,我们看两个场景:

牛爵爷在《自然哲学的数学原理》(Mathematical Principles of Natural Philosophy)中描述了包括了万有引力定律、运动定律和微积分的应用等内容,整本书包含了约 50000 字左右,对后世科学发展产生了深远影响。

而当前,一个普通博士的论文,可能都不止 50000 字了。最近一百年来,信息的密度和广度成指数型增长,任何一个期望在本专业做出突破的学生,不得不皓首穷经以期踩在前人的肩膀上在一个非常细分的领域得以继续前进,人类用每秒几KB的信息读写速度来面对信息爆炸,那么也总有一天会面对知识传递层面的“光锥之内皆是命运”。

如果不能理解这个,也可以看看自己企业内部的知识库管理,在N多部门孜孜不倦的信息沉淀下,有多少宝贵的知识变成了沉睡的字节,一直以来的,使用树形层级结构及文本匹配搜索的方式失效了,我们已经无法快速获取自己想要的信息了。在这种前提下,抛开系统不讲,我们获取我们想要信息的最佳实践是什么?

对,问别人,问活生生的人,我们可以用更高信息密度的交互模式,包括但不限于语言,图表,表情动作,让他理解我们的诉求,而他可以快速的综合各种信息,给出最匹配的答案。

曾经在某个网站上有个笑话,说当前提供两种购买商品的方式,一个是经过浏览-决策-付款-填写收货信息-收货,一个是大声喊“妈妈,我要这个!” 妈妈总是理解我们那些不易察觉的小心思和习惯,对不对。

我曾经有个断言,就是淘宝以当前的路径继续前进,迟早有一天会被抖音和小红书电商所取代,是的,不是被拼多多取代。原因在于,抖音以其千人千面的推荐算法洞悉着我们的喜好,我们自己由于社会准则的存在,尚且无法对自己有一个全面的认知,但是那些不经意的停留的行为数据出卖了我们,抖音得以比较完整的勾勒我们的形象,洞悉我们的需求。

这是淘宝梦寐以求的,但是在一个购买行为里,又能勾勒出多准确的消费者画像呢,所以淘宝推荐商品的尴尬就不难理解了(总是推荐我们已经购买或者浏览后没有付款的商品)。

我们期望更自然的输入,更自由的输出,以及更理解我们的系统,就像,一个老管家!

更进一步,假如有一天,大模型更理解我们,给出我们更想要的信息,更匹配的商品,我们真的还能接受去一个个信息孤岛上交流,购物,搜索信息吗,还能接受竞价排名对我们匹配信息的干扰吗,由此,对未来信息系统底层架构的最后一片拼图就来了:

基于区块链技术的去中心化的信息分发模式。

我们不再需要按照各个平台的要求,限制文字字数的输入文本,限制图片格式的输入图片,限制不同视频长度的输入视频,也不需要去微博看新闻,不需要去B站看番,不需要去淘宝购物。信息是原子化的,通过区块链技术保证其安全性,和不篡改性,通过大模型来处理浩如烟海的信息并给出最匹配我们需求的东西,并以我们能理解的自然交互方式给到我们,那么我们就真的迎来了新的伊甸园。

免喷声明:由于本人对信息行业的沿革发展,交互行为科学,语言大模型,去中心化的信息分发模式等都没有比较深入的理解,所以此篇文章仅作为一家之言,博君一笑(顺便暖暖公众号),如果能顺便启发你按照这个思路去思考,重构我们当前习以为常的一切,那我就善莫大焉了。

专栏作家

Kathic,人人都是产品经理专栏作家。深耕B端多年,致力于OMSTMSWMS等供应链相关产品设计。“发现、洞见、行动、反思”是我的信条。

本文原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!