浅说语音用户界面：VUI+GUI

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

司马

2017-09-02

1 评论 17911 浏览 63 收藏

8 分钟

文章对语音用户界面进行了相关的分析解读，希望对你有所帮助。

语音用户界面（VUI）

A voice-user interface （VUI） makes human interaction with computers possible through a voice/speech platform in order to initiate an automated service or process.

VUI是任何语音应用程序/设备的接口。从Siri 、Amazon echo Alexa、google home 、小冰、国内的叮咚、天猫精力、小爱同学、你好问问以及各种你听说过的，没听说过的。然而，随着技术的进步，从DuerOS的听清、听懂、满足。

以及唤醒万物，用白话说，听清靠麦克风阵列来拾音；听懂靠自然语言处理技术；满足靠数据；语音的交互呈现给用户的主要是说和听；语音交互，都是瞬态或不长久存在的信息，用户听到了，然后就消失了，用户没有可能去回顾设备的输出，听觉界面的这种瞬态特征对用户知识有一定的要求。而VUI 设计的原则之一就是不要让用户有认知负荷，不要挑战人类短暂的记忆能力。

语音，用户的直接交互的界面，人类与设备交互的逻辑会有很大的影响。而好的用户体验会带来用户对设备的认可及多次使用；满足用户意图。“我知道设备听清楚了，也听懂了，还给我提供了帮助，我不会感到迷失与焦虑”。很简单，我还会在使用它。反之，听不清，听不懂，用户会责备这个设备，觉得它很SB ，从而拒绝使用。最早的Siri为什么没有火起来也是技术条件不成熟，所以用户并不买账。

所以，在这个快的时代，现在的人们喜欢快餐，人们对新的产品没有耐心，因此，几乎没有容错的余地：VUI需要可靠地响应输入与输出，否则将被用户拒绝且抛弃。伙伴们都使用过10086吧，有没有觉得一串的按1 按2 再按* 让你有种砸掉手机的冲动？是的这其实某种程度上来讲是单方的语音交互；它一直在挑战人类的耐心。

VUI设计是一个以用户心理模型为中心的设计过程。目的是为了给用户最优的经历。创建有吸引力的交互过程，用用户习惯的、情感化的、灵活多样而有引导性的方式，使用户乐于使用，帮助用户解决问题，提高效率，赢得用户的忠诚。

声音，最自然的交互形式，但不能取代图形GUI，而是更好的协作

语音用户界面设计是一个全新的应用领域，通过语音控制来完成任务。人与人的沟通通常在不同场景与人的面部表情，动作等，能解析出不同的意图。VUI+GUI 更好的满足人机的交互。

GUI层级鲜明，好比俄罗斯套娃，一层一层直到结果呈现，想想你的朋友圈，你应该如何发朋友圈？文字与图片不同的入口。想想打开手机上的手电筒，选择消息应用程序，回到主屏幕。所有这些操作都会引用实际的空间关系，帮助我们记住并了解他们。GUI可能会考虑你的手指触摸的位置以及你在屏幕上看到的内容。这种相互作用在功能上是肌肉记忆。他们必须是一个联动的层级关系，需要每个步骤才能访问它们，那么执行此操作的认知负荷将高于简单地使用该应用程序。

VUI没有层级，可以直接获取结果，拍照，—-已经帮你拍好了，。GUI被动的交互是一种引导，传递信息。而VUI主动的交互不仅仅包含被动所能表现的，且能够主动感知或认知人来获取信息，而人还是原来的行为模式。VUI的实现基于NLP 的技术，传感器技术，以及不同类型的数据交叉处理和判断，这些处理和判断又与产品的市场需求，业务需求，产品形态的需求. 息息相关。——场景革命，语音交互任何时候都是基于场景来做调用，场景又叫技能。

服务器端处理：场景（技能）—— 意图——具体操作（结果）

这个技能场景可以是：厨房技能、音乐场景、诗词场景、APP场景、故事场景、定制业务场景、闲聊场景等。不过闲聊这个场景我个人认为是最难做的。它的边界不好限定。