智能座舱之语音TTS

加饭
1 评论 3852 浏览 12 收藏 6 分钟
🔗 B端产品经理要负责对竞品进行分析和评估,了解竞品的走向、功能、卖点、优劣势等,制定产品的策略和方向

目前在车载场景中,TTS技术的应用已经十分常见,那么,想在车载领域、智能座舱领域深耕的产品同学,你是否对车载TTS有所了解呢?不妨来看看这篇文章的内容分享。

一、TTS是什么

文字转语音,大家可以以微信的语音转文字的反向工程来理解,主要作用是实现机械对话。

二、车载领域语音合成现状分析

车载场景目前是TTS技术的重要应用场景,其发展主要经历了以下四个阶段:

其中,高度个性化的发展应该细分为两个阶段。

第一个阶段,基于人群圈层的个性化,划分的圈层可能为男性/女性,儿童/成人/老年人,车主/乘客,基于车企的策略不同。

第二个阶段,通过声纹识别或摄像头等感知手段,实现真正的千人千面,定制自己专属的TTS风格化回复。

三、当前车载场景下的痛点

  1. 机械感:听感上仍能够识别出是机械的合成音,不自然、重读不准确等;
  2. 风格单一:语音合成风格较为单一,并且多为播音风格,缺少乐趣;
  3. 情感欠缺:播报的情感音,融合进车载的交互场景方式粗暴,体验不佳,具体表现为不同情感音不区分场景、不区分文本,仅仅通过音调等变化表达情感,存在机械的僵硬感;
  4. 智能化:场景定义不全面或不准确,由于车载TTS的回复语基于车载语音产品经理对场景的定义,存在漏定义、定义错的情况;并且在通过TTS引导用户的角度看,当前所有的车企方案较少考虑到这一点。

四、车载TTS的重要指标

车载TTS的评价指标沿用语音业界的MOS评价方式,即邀请听音人试听合成语音,根据分值描述,从拟人性、连贯性、韵律感等方面为语音选择合适的分数,通常主要的指标为:

  1. 韵律准确度;
  2. 端云音色相似度;
  3. 发音准确度;
  4. 发音清晰度。

但是以上指标主要都是针对TTS发音的问题,在实际测试的过程中,也会对TTS反馈的语料准确性、是否合适等进行测试,通常单一问题单一解决。

五、语音TTS遇到的典型问题

  1. 端云变化:在汽车行驶过程中,进入隧道或停车场等场景时,车辆的网络状态会切换为弱网/无网状态,此时云端的语音资源就会切换为本地资源,切换顺滑度、音色相似度等都是典型问题;
  2. 多音字发音错误:机器未准确识别语境,发音错误;
  3. 断句错误:遇到没有标点符号或者标点符号错误的文本,机器未能识别,形成断句错误;
  4. 方言表达不地道:机器直接采用了文本的发音,未转换成方言发音。

例:

早上好,粤语应该说zou sen,而TTS会直接说早上好(粤语音调)。

没有,粤语应该说冇,而TTS会直接说没有(粤语音调)。

六、产品角度看车载TTS

1. 车载TTS的商业价值

车机作为第三个屏幕,其运营是一个说了很久的话题,但是目前真正在车机上实现商业化运营价值的车企却没有,而风格化回复语,没有安全性、政策等因素的限制,是目前能看到落地最快的方向之一,并且运营价值,如果能保证较低成本形成风格化回复语的情况下,对于具备较多智能存量车的车企来说,在我个人角度上来看为高。

2. 大模型对车载TTS可能的影响

一是个性化定制成本降低:大模型通过大量的数据学习,理想中可以快速对一些特定形象进行学习,降低学习成本,例如影视作品的角色,形成具有该角色风格的回复语。

二是更加快速合成结合业务的风格回复语:车载TTS更多的是结合业务的场景,例如导航去天安门、打开车门等,大模型结合业务将实现更加多变、准确、有趣的回复。

本文由@加饭 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 您好,看了您的文章,我感觉受益匪浅,有个疑问想请教一下您,看您提到语音TTS可能会遇到“机器直接采用了文本的发音,不能转换为方言发音”,想请问转化成为粤语句式结构的中文文本后,不能直接对应成粤语的发音吗?

    来自上海 回复
专题
100907人已学习30篇文章
想要脱围而出,你必须升级你的技能和思维。
专题
16720人已学习13篇文章
在产品的运营过程中,无论是产品、运营还是市场团队,都希望能清晰地了解用户的行为路径,通过用户行为分析,优化用户体验,实现更精准的运营和营销。
专题
13868人已学习13篇文章
发票是财务中必不可少的物品,那发票系统该如何设计呢?本专题的文章分享了发票系统设计指南。
专题
17382人已学习12篇文章
本专题的文章分享了数据的分析方法。
专题
12539人已学习12篇文章
金融产品的流程与常见策略规则类型是从事相关行业人员需要了解的重要内容。本专题的文章分享了消费金融APP流程详解。
专题
22056人已学习15篇文章
AARRR模型是一个经典的增长漏斗模型。本专题的文章针对AARRR模型进行拆解解读。