浅说语音用户界面:VUI+GUI

从零开始学运营,10年运营老司机带路,2天线下集训+1年在线学习,做个优秀的运营人。了解详情

文章对语音用户界面进行了相关的分析解读,希望对你有所帮助。

语音用户界面(VUI)

voice-user interface (VUI) makes human interaction with computers possible through a voice/speech platform in order to initiate an automated service or process.

VUI是任何语音应用程序/设备的接口。从Siri 、Amazon echo Alexa、google home 、小冰、国内的叮咚、天猫精力、小爱同学、你好问问以及各种你听说过的,没听说过的。然而,随着技术的进步,从DuerOS的 听清、听懂、满足。

以及唤醒万物,用白话说,听清靠麦克风阵列来拾音;听懂靠自然语言处理技术;满足靠数据; 语音的交互呈现给用户的主要是说和听;语音交互,都是瞬态或不长久存在的信息,用户听到了,然后就消失了,用户没有可能去回顾设备的输出,听觉界面的这种瞬态特征对用户知识有一定的要求。而VUI 设计的原则之一就是不要让用户有认知负荷,不要挑战人类短暂的记忆能力。

语音,用户的直接交互的界面,人类与设备交互的逻辑会有很大的影响。而好的用户体验会带来用户对设备的认可及多次使用;满足用户意图。“我知道设备听清楚了,也听懂了,还给我提供了帮助,我不会感到迷失与焦虑”。很简单,我还会在使用它。反之,听不清,听不懂,用户会责备这个设备,觉得它很SB ,从而拒绝使用。最早的Siri为什么没有火起来也是技术条件不成熟,所以用户并不买账。

所以,在这个快的时代,现在的人们喜欢快餐,人们对新的产品没有耐心,因此,几乎没有容错的余地:VUI需要可靠地响应输入与输出,否则将被用户拒绝且抛弃。伙伴们都使用过10086吧,有没有觉得一串的按1 按2 再按* 让你有种砸掉手机的冲动? 是的这其实某种程度上来讲是单方的语音交互;它一直在挑战人类的耐心。

VUI设计是一个以用户心理模型为中心的设计过程。目的是为了给用户最优的经历。创建有吸引力的交互过程,用用户习惯的、情感化的、灵活多样而有引导性的方式,使用户乐于使用,帮助用户解决问题,提高效率,赢得用户的忠诚。

声音,最自然的交互形式,但不能取代图形GUI,而是更好的协作

语音用户界面设计是一个全新的应用领域,通过语音控制来完成任务。人与人的沟通通常在不同场景与人的面部表情,动作等,能解析出不同的意图。VUI+GUI 更好的满足人机的交互。

GUI层级鲜明,好比俄罗斯套娃,一层一层直到结果呈现,想想你的朋友圈,你应该如何发朋友圈?文字与图片不同的入口。想想打开手机上的手电筒,选择消息应用程序,回到主屏幕。所有这些操作都会引用实际的空间关系,帮助我们记住并了解他们。GUI可能会考虑你的手指触摸的位置以及你在屏幕上看到的内容。这种相互作用在功能上是肌肉记忆。他们必须是一个联动的层级关系,需要每个步骤才能访问它们,那么执行此操作的认知负荷将高于简单地使用该应用程序。

VUI没有层级,可以直接获取结果,拍照,—-已经帮你拍好了,。GUI被动的交互是一种引导,传递信息。而VUI主动的交互不仅仅包含被动所能表现的,且能够主动感知或认知人来获取信息,而人还是原来的行为模式。VUI的实现基于NLP 的技术,传感器技术,以及不同类型的数据交叉处理和判断,这些处理和判断又与产品的市场需求,业务需求,产品形态的需求. 息息相关。——场景革命,语音交互任何时候都是基于场景来做调用, 场景又叫技能。

服务器端处理:场景(技能)—— 意图——具体操作(结果)

这个技能场景可以是:厨房技能、音乐场景、诗词场景、APP场景、故事场景、定制业务场景、闲聊场景等。 不过闲聊这个场景我个人认为是最难做的。它的边界不好限定。

场景的要素:

  1. 哪里的用户?(环境)(根据不同场景建立不同业务逻辑与规则)家庭?户外?闲聊?厨房?音乐?
  2. 他们要做什么?(目的
  3. 他们互动的设备的类型(媒介)机器人?Echo ? iPhone?computer?……
  4. 什么时间?(时间)时间的维度可以更好情感化设计。
  5. 他们正在试图做什么?(行为
  6. 尽量满足他们的意图,而不是一个特定的功能。(目的
  7. 意图:需要多个维度去判断,视觉,听觉,记忆,用户习惯等。
  8. 哪里是用户心灵的框架?(用户模型?)用户任务精神模型(根据不同用户受众,进行不同的任务流程)
  9. 场景多维度属性(场景属性)

VUI+GUI

语音与视觉的交互是交叉处理,(多模态),说白了,一个用户指令,设备有多种反馈的方式,可以是声音,灯光,动作,界面,表情,等各种交叉的反馈。 什么样的多模态交互是用户需要的呢?这就需要基于场景的要素去进行交互规则设计。(下图机器人语音交互部分流程)

 

本文由 @ 司马 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Pixabay,基于CC0协议

欢迎打赏支持原创
6人打赏
评论
有话不说憋着难受
  1. 编辑段落都给我搞错了,差评! 换了我的图,差评! :o

    回复