AI加持下,“扫一扫”能玩出哪些花样?

1 评论 4055 浏览 18 收藏 12 分钟

随着AI算法效果的不断提升,扫一扫的对象已经从码图扩展到各种真实生活中的领域,那在现有的基础上,“扫一扫”能玩出哪些花样?

“扫一扫”是我们在日常生活中使用频率比较高的功能。

它有很多优点,比如快捷准确地连结人与人/人与机器;能支持多人多设备同时扫,提高操作效率;不会暴露手机号这种影响更直接的个人信息;以及在疫情期间,还体现出了无接触的优点。

随着AI算法效果的不断提升,扫一扫的对象已经从码图扩展到各种真实生活中的领域。可以扫物、扫人、扫文字、扫剧照、扫外文、扫名片、扫文本,还能扫各种Logo。

(应用场景举例)

本质上,扫码、智能识别和AR功能,是三件不同的事情,但它们都以相机预览作为载体。出于节省空间/统一交互形式/符合用户认知等原因,最终归类到同一入口内。本文中,我会重点分析一下智能识别层面的扫一扫功能设计。

一、变身为大搜索入口的“扫一扫”

在各种AI算法加持下,很多“扫一扫”已经变成了实质上的“搜一搜”。用户通过扫一扫的形式,去搜商品、搜人物、搜资讯、搜垃圾分类规则……

1. 需求点

当我坐地铁看到一双非常喜欢的鞋时,可能不好意思上前问人家要购买链接。这种时候,扫一扫搜商品的功能就可以派上用场。

当我看到一株不认识的植物时,可能描述半天也讲不清楚它的特征是什么。按图搜索能够很好地解决这个痛点,让我能更快速准确地找到自己想要的东西。而且从个人感受上来说,形色识花是我家人群里出现频率最高的小程序之一。如果看到不认识的植物,他们都会打开微信识别一下。

这些类似于“这是什么?”的问题,几乎都可以考虑用“扫一扫”搜索来解决。因为图片的描述能力可能比语言更加直接和客观。

2. 功能价值

提供这么多种类的扫一扫,大家的目的是什么呢?

扫一扫识物的目的是开辟一个用户直达微信内部生态内容的一个新窗口,该窗口以用户扫图片的形式作为输入,以微信生态内容中的百科、资讯、电商作为展示页提供给用户。除了用户非常熟悉的扫操作,后续我们会进一步拓展长按识图操作,将扫一扫识物打造成用户更加触手可及的运用。

扫一扫识物的落地场景如下图所示,主要涵盖 3 大部分:

  1. 科普知识。
  2. 购物场景。
  3. 广告场景。

——微信「扫一扫识物」的背后技术揭秘

上文引用自微信技术团队的一篇文章。可以看出,扫一扫识物本质上类似于一种搜索入口。通过扫物,来检索出微信生态内各类相关的信息。包括上文中提到的长按识图,已经有一些手机厂商做过,都是通过识物/识图这种形式,把自己变成了最直接的搜索入口,通过自己去进行资讯的分发和购物渠道推荐。

除了微信这种大生态外,在一些细分领域内,扫一扫搜索也有助于引发用户在产品内下一步的行为。以爱奇艺为例,用户在按图搜剧之后,下一步就有可能点开对应的影视剧进行观看。当我使用拍图搜车时,下一步就会直接在APP内进一步了解关于这辆车的详细信息。

此外,一些新颖的扫一扫功能也可能有助于拉新促活。例如去年垃圾分类的话题火热时,有好几款APP顺势推出了扫一扫垃圾分类。扔垃圾是生活中的高频行为,如果通过推出垃圾识别,能够让用户更多地打开甚至停留在自己的APP内,也是很有帮助的。

二、“扫一扫”的设计

趋势:弱化扫码界面和扫物界面的差异

目前,复合功能的扫一扫,都在弱化扫描的特征。

在上一版微信的更新中,我们可以发现,以前的扫一扫界面,从扫描仪的形式变成更加清爽的相机预览界面。而用于聚焦的黑底和模拟扫描仪的网格都不见了。打开淘宝也可以发现,扫一扫和拍照两个入口下的内容,相差很小,从扫一扫也可以流畅地切换过去。就在我这篇文章写了一半的时候,突然发现支付宝也修改了扫描界面。这种修改的目的,除了能够使几个子页面的设计风格更加一致外,也可能是向用户传达,除了扫码,我们还能做更多。(当然,如果APP内扫一扫只是用于扫码,也没有必要从设计上弱化扫描的特征。)

面对这些相似的功能,不同的公司选择了不同的入口名称。例如支付宝和微信都选择了“扫一扫”这个定义;百度和拼多多则选择了“拍照”;而淘宝则把两个入口都留了下来。

这里的扫一扫和拍照,虽然命名不同,但本质都是识别+搜索。定义为拍照的,大多会把这个相机icon直接放在搜索框内。因为逻辑上,以图搜索、语音搜索和最常用的文字搜索做的都是同一件事。下一步的趋势中,搜索框是否会变成文字+相机+麦克的形式呢?

保持逻辑/交互/视觉的一致性

关于定义为拍照还是扫一扫,各家APP都有不同的做法。不论采用哪一种,我们都应该尽量保持用户体验的一致性,包括逻辑、交互、视觉各个层面,在自己的APP内都要保持自洽。

“扫”和“拍”这两个词在概念上的差异点,主要在于有没有点击拍照按钮的这个动作。扫一扫是识别后自动触发,而拍照是点击后触发识别。如果使用“拍照”作为定义,那么内部的交互行为应尽量与拍照相一致。

截图来自于一款汽车APP,在两个tab内使用了不同的图标来表示拍图识车这个功能,这就会让用户比较困惑。

结合技术的设计创新

算法分析和检索图像会花费一定时间,多数APP会添加动效来缓解用户等待的焦虑。常见的是为真实场景的关键点添加动效,这种做法会比过去纯平面的GIF动效更加真实。能够让用户感觉到真的正在对空间内的物体进行分析,而不是只放个GIF贴图糊弄一下。

除了常规的关键点动效外,还有公司采取了其他方案。下图是百度的识别动效,看起来蛮酷炫的。当我们通过技术革新获得了关键点、边缘分割等信息时,在设计效果上也可以结合技术进行一些新的尝试。

三、一点思考,扫一扫的未来属于谁?

以前支持扫描各种二维码的APP并不多,用户主要习惯使用微信扫一扫。许多用户(尤其是年纪稍长的人),看到二维码,就会想到使用微信。微信也因为扫一扫这个功能,进一步提升了用户打开APP的频率。

其实在很多扫一扫场景下,微信是承载了手机网页浏览器的功能。现在手机厂商回过神来,纷纷在自有入口内加入了对二维码识别的支持。同时,华米OV也加入了不少花样识别的功能。

例如华为和OPPO的拍照识别卡路里,解决健身人群的烦恼。小米可以拍照搜题,解决学生群体的烦恼。还有商品识别,是和第三方进行商务合作的入口。

华为还推出了“河图”,要把地图/本地生活/AR都收入自己的平台内。作为平台规则的制定者,手机自带的各类入口可以比APP有更高的优先级。例如看到路边的植物时,我可以抬起手机(自动亮屏),点击锁屏内的相机按钮,拍下一张超好看的照片,顺便了解下这种花叫什么名字。这是很流畅的使用场景。

写完这篇之后,愈发感觉,手机端纯搜索引擎的压力确实比较大。许多以往要在百度网页内打字描述的问题,其实很容易就被其他专业领域内的APP分流,甚至手机厂商自身也要从中分一杯羹。

技术方、大APP、手机厂商,多方都在扫一扫的领域内不断深入,似乎都越来越倾向用自有的产品或平台把用户留住。

那么在以后,能够赢得用户的差异点在哪里呢?

是像形色识花这样在细分领域不断深入的产品建立了数据的护城河,还是微信这样的大生态更有吸引力,还是说手机厂商依靠自身平台会越来越强势呢?

参考阅读:

淘宝摄像头大解密:智能识别体验设计 – 淘宝设计的文章 

微信「扫一扫识物」 的背后技术揭秘 – 腾讯技术工程的文章 – 知乎

#专栏作家#

迷思特圆,作者公众号:迷思特圆(ID:mryuan55),人人都是产品经理专栏作家。目前负责新技术以及ToB相关的产品设计,擅长需求调研和交互设计。

本文原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash ,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 看完这篇,好像有点懂了为啥最近手机厂商也疯狂招产品经理。

    来自湖北 回复