智能座舱之语音唤醒

0 评论 2480 浏览 7 收藏 5 分钟

在越来越多场景下,我们可以看到智能语音的应用,而其中,“语音唤醒”这个概念是必然要被提及的。这篇文章里,作者就对“语音唤醒”的定义、功能、问题等方面做了解读,一起来看看吧。

一、智能语音的发展趋势

2017年,小爱同学、天猫精灵诞生,到2019年分别基于手机、家庭开始打造以语音交互为核心,智能场景协同的护城河;

2020年智能音箱在国内销量一度达到1.51亿台,成为继手机之后的销量最大的终端智能消费品类。

消费类智能语音终端的趋势:

  • 单设备、单场景的指令交互向多设备、全场景的智能交互发展;
  • 从单感官的交互方式向多感官的人机交互(多模)演进;
  • 从功能性向情感陪伴的精神需求演进。

二、什么是语音唤醒?

在连续语流中实时检测说话人特定语音片段。

三、语音唤醒的指标有哪些?

唤醒率:用户交互成功率。

误唤醒:用户未进行交互,误触发的概率,一般以一天发生几次计算。

响应时间:用户说完唤醒词后设备给出反馈的时间。

功耗水平:唤醒系统的耗电量如何,由于目前智能座舱应用于新能源汽车,该指标可不计。

四、语音唤醒能够做的具体功能

oneshot用户无需等待唤醒反馈,即可发出工作指令。例:“你好百度播放音乐”,客户端会在唤醒后直接启动识别以及语义理解等服务。

多唤醒:满足用户个性化的唤醒词候选。例:百度的车,你可以用“你好百度”,用户也可以自定义“你好腾讯”。

ZERO-SHOT:将常用指令作为唤醒词,达到用户无感知的唤醒效果。例:“打开车窗”、“导航到天安门”作为唤醒词,实现快速响应;这种唤醒策略,为了减少误唤醒平吕,大多情况下都会限制唤醒词范围。

五、语音唤醒遇到的典型问题

场景鲁棒性:在环境嘈杂的情况下,通常会唤醒失败或者误唤醒,常见的车内场景:播音场景、开窗场景、高速场景、交谈场景等,该类场景通常作为路试的必须场景。

相似词误唤醒:例:当唤醒词为“你好百度”,此时说“你好小度”。

提前唤醒:当唤醒词为“你好百度”,此时说“你好百”就唤醒。

词嵌套:当唤醒词有“百度”“百度助手”,用户准备喊“百度助手”,“百度”被唤醒。

六、产品角度看语音唤醒

用户体验:语音唤醒作为语音交互的开始,唤醒率极大的影响了用户对语音的使用欲望,目前智能座舱的语音唤醒率普遍已经实现≥95%,能够给到用户较为满意的体验。

未来趋势:如今各家都在这点上做不断地优化,同时开始向多模语音的方向发展,但是多模交互在当前技术阶段,存在支持范围受限、误唤醒率高、成本较高等问题,语音唤醒词在一段内,仍是市场主流的选择。

未来随着VPA、主题世界、大模型对话在车机上的应用,唤醒词可能会随着语音风格等有着更加有趣的变化。比如“你好,嬛嬛”,“华妃在哪”。

品牌价值:语音唤醒词在一定程度上也对品牌的塑造有一定的价值,目前各家的默认唤醒词通常都为语音助手的名字“理想同学”、“小琪”、“小P”等等, 在日常语音使用中,不断深化用户对品牌的认知。

本文由@加饭 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 目前还没评论,等你发挥!