以微软小娜和出门问问为例,分析虚拟人工助手产品

1 评论 6134 浏览 35 收藏 21 分钟

近年来,虚拟人工助手迅速火热,本文以产品经理视角分析一下当下热门的微软小娜和出门问问。

一、发展背景及用户需求分析

1.发展背景

语音是人与人之间交流最方便快捷的方式之一,具备非接触、简洁高效等特性。

随着人工智能的快速发展,语音产业也得到了快速发展,并在其中占据着重要地位,如图1所示,语音市场行业规模在逐年扩大。

虚拟人工助手作为语音产业的典型产品也在快速发展,各大公司均在推出自己的产品,如苹果Siri、谷歌的Google now、亚马逊ALEXA、微软“小娜”CORTANA等等。

虚拟人工助手通过语音输入获取信息,控制手机程序以及其他设备,帮助用户提高获取信息和操作手机的效率,使其快速做出合理的决策。

本文以出门问问和微软小娜为例,对虚拟人工助手的产品功能、操作效果和商业模式进行分析,以求进一步完善虚拟人工助手的产品功能和商业模式。

出门问问目前自主研发了一整套人工智能交互技术,包括热词唤醒,语音识别、语义理解、垂直搜索、语音合成,智能推荐和计算机视觉。从多个维度,打造优秀的人工智能交互体验,已成为中国人工智能领域语音交互技术与产品化的领军者。

微软小娜(Cortana)是微软发布的全球第一款个人智能助理。它“能够了解用户的喜好和习惯”,“帮助用户进行日程安排、问题回答等”。它的产品方向是让手机用户与小娜的智能交互,不是简单地基于存储式的问答,而是对话。

2.用户需求场景

场景一:双手忙碌,无法打字的人

A在正在开车,想和家人打个电话,晚点回家,并且在B地区附近找个餐馆,给一个朋友发个短信一会就到,然后想听首周杰伦的歌曲,顺便把车内空调的温度调低一点。

如果开车的时候手动完成这些事,将会严重影响开车。但有了虚拟人工助手就不一样了,只需要输入语音就能完成自己自己想做的事了。

“助手,拨打我老妈的电话,B地区附近有什么好吃的,给c发短信说我一会就到,我想听周杰伦的歌曲,把空调的温度再调低一点”,通过语音就完成了自己想做的事。

场景二:工作学习或生活中事情多但容易忘记的人

大二同学小Q要上课,参加社团活动和做兼职,特别忙,所以总是忘记自己要做的事。

通过小助手就可以准确提醒自己做的事,前一天晚上小Q打开虚拟人工助手,说:“我明天晚上六点要给父母打电话,9点去沃尔玛,到沃尔玛后要提醒自己买洗发水和纸巾。”然后虚拟助手通过建立时间提醒和地点提醒来提醒用户完成需要做的事。

场景三:手机APP数量繁多,想一键操作所有应用的人

小H早上起床上班前总是有很多事做,要打开微信看一下有没有新的消息,打开时钟设置个提醒中午要去银行取个钱,打开浏览器查下美元和人民币的汇率是多少。

刷牙的同时想打开新闻软件知道今天的体育新闻有什么,同时要把空调关了。

通过虚拟人工助手直接语音输入一系列命令,就会打开微信,设置提醒,查出汇率,搜索体育新闻,通过遥控助手关掉空调。

场景四:想快速找到符合自己要求的信息,避免层层筛选的人

小S想在在A地区找个酒店,价格优惠,提供早餐,环境安静,并且离地铁站比较近的。

通过传统APP搜索需要层层筛选,各种对比,但是如果告诉虚拟人工助手这些信息,助手就能快速帮你找到符合要求的酒店,避免传统APP的筛选条件限制。

场景五:不方便打字的老人、小孩、盲人和手有残疾的人。

叔叔是个盲人,平时获得信息只能从电视声音、电台等渠道被动获取信息,想要主动获取信息很难,只能和别人口述,在别人的帮助下获取信息。

但有了虚拟人工助手后,就可以通过语音输入查找自己想要的信息,十分便捷。

二、基本产品功能分析

1.产品基本功能

操作系统:Android8.0.0

体验版本:微软小娜2.10.4,出门问问6.7.0-2211

Slogan:微软小娜(从电脑到手机,你随时随地的个人助理),出门问问(随时随地,个人助理)

出门问问产品功能图:

微软小娜的产品功能图:

2.功能结构分析

从整体上看微软小娜的用户界面更加简洁,功能只有语音服务及其相关功能,点击进去首页主界面直接为自己设定过的提醒,一目了然。

出门问问,点击进入首页主界面后,虽然显示“Hi,这是你今天的安排”,但下面依次显示的是每日签到、开心出行(24小时天气变化,上下班路况、限行尾号、日历)、今日计划、涨知识(内容推荐、每日一言、今日百科)、待办事项。

将出行的相关功能放在了首位,虽然功能紧扣“出门”,但是不符合用户的使用习惯。

作为一个虚拟个人助理软件,首先显示自然是用户关心的东西,用户自己设置的事项。但出门问问整体的功能更加丰富,通过一览、兴趣、发现等功能与用户互动,有利于增强客户的粘性。同时通过发现和商城,出售公司的硬件产品,获得盈利。

并且从具体语音服务功能,可以看出微软小娜和出门问问的有以下不同,如表1:

3.操作流程及操作效果对比分析

(1)操作流程

微软小娜和出门问问操作流程图:

从以上操作流程看,微软小娜的操作流程更加简便,但两者都是通过传统的方式点击图标进入界面。

微软小娜不具备热词唤醒功能,出门问问进入聊天界面后可通过热词唤醒功能进行聊天,但十分不灵敏,技术有待提高。

输出结果的过程出门问问比微软小娜更快,有着更加优越的信息抓取功能。

然后输出的形式都是只有一部分是语音输出,大部分依然是文字或图片输出。输出的结果基本为网页搜索结果。

(2)操作效果对比

微软小娜和出门问问操作效果对比:

虚拟人工助手一般要由三部分组成:

  • 语音信号转换为文本信息的语音识别系统。
  • 提取用户说话语义信息的语义理解系统和数据挖掘系统。
  • 数据抓取系统和语音合成系统。

整体来说,微软小娜是偏向工作方面的,出门问问是偏向出行娱乐方面的;微软小娜所用的资源均是来自公司自己的数据—微软必应,出门问问出现的资源大部分为外部链接,和各领域内的企业合作。

在相对安静的环境下,微软小娜和出门问问的语音信号转化为文本信息的语音识别系统已经满足基本的需求。

在使用过程中,30厘米的人机距离,中文语音转化为文本除了名字和缩略词均没有出错。语音识别过程中,微软小娜会显示正在聆听,当使用者语音输出完毕后,再转化为文本,然后进行处理。

出门问问,在使用者输出语音的过程中就会转化为文本,语音输出完毕后,就会显示结果,速度很快。

在第二个阶段虚拟人工助手应该能够准确的理解用户的需求,然后通过数据库连接和全网搜索,将服务送到用户的手上。

微软小娜的语义理解更加智能,出门问问会出现差错,如“泰山有多高”结果出现的人的身高,与用户需要的信息相差很大。

数据方面,微软小娜基本都是采用本公司的必应系列产品,数据就相对单一、不完善,出门问问基于全网搜索,并且和其他企业合作,信息获取的比较丰富。

在第三个阶段虚拟人工助手具有了“说”的能力,能够将信息“读”给用户听。并且也应具备挑选信息对的能力。

从技术层面看,这个过程应该有语言处理、韵律处理和声学处理,使合成语音能正确表达语意,听起来更加自然。这个过程微软小娜和出门问问均没有实现,输出的语音不够自然,同时输出结果多为搜索界面,需要用户自己进一步操作选择,与传统浏览器相比没有很大的优越性。

4.功能建议

通过对产品的体验及其分析,可得出以下建议:

(1)热词唤醒功能

得到用户同意后,能够通过麦克风,实时检测用户的语音,在虚拟人工助手首页,能够语音唤醒语音服务。甚至当该软件运行后,不论手机处于什么界面都能够唤醒语音服务,以此减少手动控制动作,提高语音服务的效率和方便性。

(2)搜索结果需改善

搜索结果需要更加简明,通过选择权威高的域名、容易读容易理解的内容或者PC端排名好的内容,只需显示一条结果即可,避免用户的再次选择和点击。

利用当下的轻量级的深度学习技术,在获得用户权限后,通过访问用户的手机其他信息和日常操作行为,获得用户的喜好后,为用户提供个性化的信息,从而改善用户体验。

(3)信息输出细节改善

信息输出应该有文字输出和语音输出的设置,出门问问已具备此功能,但微软小娜并不具备。在输入的时候,微软小娜拥有语音输入和文字输入两种形式;出门问问只有语音输入功能,在一些情况需要用到虚拟人工助手,但不方便语音输入和输出,因此应该有相应的设置选项。

设置语音输出后,在输出结果的时候应直接有语音输出。

首先是翻译和计算等功能,需要直接显示对应结果,并能够语音输出。对于音频服务,显示结果后可以自动播放,并推荐相应歌单。

对于新闻百科等信息,界面显示之后,能自动提取用户需要新闻和百科知识的关键字词,以简短的话语语音输出用户所需要新闻和百科知识,或者直接链接到音频服务,进行新闻播报。

(4)语音合成需要改善

输出语音过于僵硬,文本分析模块的输出可以带有一定标记的音标序列,在这些标记中包含必要的韵律控制信息,如轻重缓急,抑扬顿挫,甚至是不同的感情风格,是语音输出更加的自然。

(5)具体功能细节改善

控制应用功能改善:

拨打电话和发信息的理想状态,应该是说出人名和命令就能够打电话和发短信。微软小娜的电话服务不能使用,出门问问需要说出电话号码才能拨电话和短信,但通常人们是记不住电话号码的,所以功能相当于无用,亟待改善。

打开网站,当说出一个网站名称的时候应该是直接进入该网站的首页,不是浏览器首页或者搜索界面。

提醒功能的改善:

微软小娜的提醒分为时间提醒和地点提醒,体验效果比较好,是为比较理想的提醒设置,出门问问针对此方面应该做出改善。

天气功能改善:

根据手机定位和气象数据计算,可以为用户提供精确到街道和小时的天气状况,避免出现局部有雨等帮助不大的信息,为用户出行提供切实帮助。

(6)小结:

我认为虚拟人工助手的本质是让用户拥有一个“无所不知”、“无所不能”的私人秘书,帮助用户更加便捷高效的获取信息和完成一些常规的事情。因此在技术允许的情况下,应使虚拟人工助手更加像人,各类功能更加趋向于人的行为习惯。

三、商业模式分析

1.平台模式

大数据平台

可以利用其用户范围内的优势为其采集大量优质数据。

相比传统的搜索引擎,虚拟人工助手的搜索涵盖了用户的工作、衣食住行甚至情感等各个方面。能够获得更加全面的数据,同时对用户的情况进行精准的分析,了解用户需求,进行个性化内容定制,推出更适合用户需求的产品。

数据除了供自身企业使用外,也可以出售统计分析数据来获得收入。

售卖变现

当获得庞大的用户数量后,通过用户转换,为用户提供交流、资讯、娱乐、搜索、电子商务、办公和企业客户服务等全方位的一站式的服务;其次基于用户的行为,可以通过分析衍生出相关需求,进而通过开发新产品满足用户的需求。

广告平台

广告收入一直都是平台类产品的主要收入来源,因此也可以作为虚拟人工助手的来源之一。但是内容要求与投放方式与传统广告投放有很大不同,在虚拟人工助手中,广告的内容应更加简洁有效,并具有一定的具有情感性。

在投放形式上,要更加精准定位。当用户收到广告后,就像朋友推荐一样,使用户更加容易接受其内容,从而真正成为广告主与用户之间连接的桥梁。

流量与佣金分成

在用户使用过程中,能将自身流量导向指定的第三方企业,为其销售实现提供帮助而获得的报酬。其次可以让商家入驻自己的平台,来赚取佣金。

2.内容模式

提供优质及独特的内容服务,通过付费会员、会员等级、功能购买的方式,扩展收入来源。

可以与专业领域结合,与旅游结合使虚拟人工助手成为对景点知识无所不知的小导游,并可以提供各种外语的讲解,弥补二三线城市外语导游数量的缺少。

与教育结合使虚拟人工助手成为可以随时随地互动的老师。

与客服部门结合,减少人工客服的工作量,提高其工作效率。在这些过程中,可以以会员的形式进行,也可以直接面向B端,进行服务收费。

3.终端模式

目前的终端主要包含智能手表、手环、音响、电视等硬件产品,使软硬件产品相结合,给用户带来更好的服务体验,硬件产品及其承载的视频、音频、应用及其他增值服务都会给企业带来一定的盈利。

4.微软小娜和出门问问的商业模式

微软小娜信息呈现形式大部分还是以搜索引擎搜索网页界面呈现,因此延续了搜索引擎广告收入的盈利模式。

出门问问的商业模式一方面是是软硬结合,以虚拟人工助手为中心的跨场景联动,推出智能手表、智能音响、问问魔镜等产品,并与其他公司合作实现语音交互技术在户外、车载和家居等多个场景的应用落地。另一方面,也通过给但三方企业引流,来获得流量分成收入。

微软小娜作为微软公司的一个子产品,在提高技术和服务体验的基础上,以微软小娜为中心,连接其他产品,可以为顾客提供一站式的服务,使微软小娜成为一个新的流量入口。

出门问问在现有产品基础上,可以在其商城内引入其他人工智能产品,赚取佣金服务,同时进一步推动语音交互技术在各个领域的方案落实,通过技术和内容服务获取盈利。

四、总结

当前我们生活的方方面面大部分都要借助智能手机完成,打开手机里面有着各种各样的APP,满足我们的各种需求。

以后,或许手机中只需要一个虚拟人工助手就行了,他可以了解我们的喜好,满足我们各种需求,给我们提供信息,帮助我们做出决策,代替我们完成常规的事。

 

本文由 @建川 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Pexels ,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!