淘宝智能直播间:虚拟主播直播带货这条路走通了吗?

4 评论 3561 浏览 3 收藏 29 分钟

编辑导读:昨天的双十一预售你参与了吗?很多人现在网购都喜欢从直播间直接购买,大量消费者的涌入对平台和主播来说都是一个不小的挑战。因此,淘宝直播间推出了虚拟主播直播带货。这条路走得通吗?本文作者对此进行了分析,希望对你有帮助。

一、淘宝智能直播间是一款怎样的产品

不知道大家有没有发现,深夜打开淘宝会发现越来越多商家在使用虚拟主播直播带货。虚拟主播们不仅可以介绍商品,还能回答问题,欢迎新进直播间的观众,甚至和观众玩互动小游戏。这个2020年夏天投入测试的功能,目前已经正式对外支持淘宝商家申请使用。

从官方的介绍来看,该功能模块名为“智能直播间”,是由智能技术驱动虚拟形象进行自动化开播、个性化推荐的一款智能产品。可以通过捏脸换装,选择适合的声音,一键化生成脚本等方式实现7*24无人直播。

二、为什么会出现智能直播间?

洗去浮华的直播带货行业日渐规范和成熟,但竞争依然激烈。

对平台来说,在直播带货模式逐渐泛化且深入的当下,流量争夺成为各平台需要面临的重要考验。提升同时段直播吸引力并且在无人时段依然具备引流能力是每个平台需要攻坚的重要堡垒。

对用户来说,随着观看直播购物已经成为常态化行为和“刚需”,直播秒杀等优惠活动带来的价格优势逐渐减弱,用户在价格之外也更关注直播体验。能否立刻看到直播介绍、介绍内容是否专业、直播画面是否美观等都成为影响用户决策的重要因素。

对商家来说,2020年以来商家自播获得了较多的流量扶持,不过对抗主播红人的流量优势依然艰难,大部分缺乏运营经验的商家需要长时直播、频繁直播才能获得流量倾斜,而且直播带来的关注转化和销售转化都不一定能覆盖直播成本。货品价格优势的日渐衰微,使得直播内容质量和直播时长开始成为赢得转化的重要突破口。直播内容质量方面目前主要有以下几个进化方向:

  • 直播间硬件升级:包括直播间装修、拍摄设备、灯具照明等硬件,竭力凸显产品的真实面貌;
  • 视觉效果升级:目前市面上出现了很多支持虚拟场景展示的服务方,以真人绿幕抠图叠加虚拟背景实现,可以任意变换不同的虚拟场景直播互动;此外众多品牌方也大幅提升了直播间贴片图的美观度,将画面空间充分利用了起来进行品牌宣传;
  • 主播能力进化:一方面真人主播侧涌现了众多专职主播,网红属性弱化的他们专业性更强,更利于店铺流量沉淀;另一方面虚拟主播也开始在直播带货领域冒头,最开始出现的虚拟主播是由真人穿戴动捕设备扮演,主要是来提升直播趣味性并方便IP变现,但是动捕设备高昂的购买成本和使用成本终究还是阻挡了一大批商家;现在淘宝开始推出智能虚拟主播,可以实现24小时无人自动直播,目的是通过拉长直播时长以及争夺无人时段流量来实现转化,尽管“机器感”较重,但也一定程度弥补了真人主播的成本和工作时长劣势。

三、淘宝智能直播间产品分析

对于目前淘宝智能直播间的表现,我们可以从虚拟内容生成、虚拟内容展示、直播互动几个角度进行解读分析。

1. 虚拟内容生成

对于传统电商直播,文本凝聚着商品的核心信息,真人主播将商品信息吸收转化再通过直播间传达。而智能直播所提供的虚拟内容,同样离不开虚拟主播和文本内容这两个重要部分。

在淘宝智能直播间,商品介绍文本是通过抓取商品详情页的图文信息智能生成的,无需用户手动输入(当然这些文本支持用户更改),这对于不善直播运营撰写介绍文本的中小商家是非常友好的。将生成的介绍文本进一步转化成语音并驱动虚拟主播的表情和动作,如此一个活灵活现可以介绍商品的虚拟主播便生成了。

形象方面:虚拟主播模型支持自由配置换装,卡通的形象风格与淘宝人生一致,不知在技术方面是否完成了打通。

语音方面:与一般平缓的人工智能语音不同,这些虚拟主播参考了真人主播的发音和语气,情绪更为饱满更适用于直播带货场景。而且支持声音定制,商家只需要提供半小时的录音,TTS技术不仅能用主播的声音播报,还能用主播的声音说外语。

文本解析与表现方面:虚拟主播的语音、表情、动作极力模拟真人主播,并紧扣文本内容突出重点地表达。比如强调产品卖点和催买时,虚拟主播的表情、音量、动作都会放大来强化信息传达。

2. 虚拟内容展示

有了主播有了要介绍的内容,如何进行有效的传达是智能直播面对的一大难题。因为真人主播有着更强的表现力,商品也可以实操演示,让观众所见即所得。虚拟主播再拟人也很难达到真人主播的表现力,无人辅助的情况下演示真实商品那更是不可能实现。那虚拟内容在展示上有哪些优势又怎样规避劣势呢?我们可以分成虚拟场景和信息传达两部分来看。

虚拟场景方面:直播间会使用一个有三维空间感的虚拟背景,大多为室内场景。且跟随讲解背景会有变化,一种变化是随着虚拟主播的讲解会有一个横向的运镜变化,展示全景的虚拟空间;另一种是现在看到的比较多的,讲解商品时背景显示蓝幕,蓝幕上展示商品图片,讲解完商品后切换回虚拟室内场景。场景化的虚拟背景更有空间感,不受真实场景约束有更大的想象空间;同时加入景别变化使得画面更丰富,降低了用户长时间观看的沉闷感。

信息传达方面:淘宝智能直播间目前主要借助了三类载体进行传达商品相关信息,弥补无法实操演示的短板:

  • 商品卡片:早期版本画面右侧的商品卡片会动态展示商品相关图片/视频,商品名称和价格也会一并显示,用户可以直接点击这个链接进入详情页;目前版本则多采用蓝幕背景,在画面中上位置展示商品相关图片/视频,商品名称和价格会根据图片/视频素材的比例进行动态布局。这其实是将原先的视频卡片拆分掉,将图文部分拎出来,放在用户视觉中心区着重展示。剩下的链接跳转功能,只突出“价格”信息和“下单点我”的引导信息,减小卡片面积放到画面左侧位置。整体来看,虽然无法实际演示产品,但是图片/视频信息动态展示也能起到一定作用,并且名称、价格甚至原价等核心信息很齐全,此外商品卡片链接也具有较强的引导性,缩短了用户的购买路径。
  • 文字字幕:在虚拟主播旁边会有一个文字字幕显示出来,内容就是显示虚拟主播当前播报的文字内容。主播已经在说话了为什么还要支持字幕呢?在笔者看来多一路信息传播渠道,方便信息更好的接收,既听得到也看得到,这是正常直播无法做到的,有效支持了不方便开语音的直播观看环境。
  • 关键词特效:当主播说道商品的一些卖点时,画面中会弹出卖点的关键词文字特效,如“特别实惠”“买一送一”等,此举进一步强化了核心信息的传达,加深了用户感知。商品讲解已经是视听结合的环境下,到了关键地方还刺激用户一下,帮助用户接收更多“有效”的商品信息。

3. 直播互动

如果只是智能生成虚拟内容进行讲解的话那和录播也没什么区别,直播最重要的就是互动,及时获知观众需求进行有效反馈,智能直播间能有什么互动能力呢?从现有案例来看,进行互动的主体是虚拟主播,其次是智能直播间的一些系统反馈。虚拟主播目前有以下几个互动能力:

  • 问答互动:这是其最重要的能力,系统可以识别出评论区的问题,匹配答案,再通过虚拟主播插播答案。测试下来目前的回复能力比较有限,主要是对红包优惠、介绍某号商品、询问主播身份等常规问题进行有效回答。进行回复时,会中断当前直播内容,插播答案,插播完再从之前的位置继续讲解,体验欠佳。
  • 进场互动:系统可以识别出新进入直播间的观众昵称,虚拟主播会插播说“欢迎XX进入直播间”等相似内容,对于用户的关注和分享行为也会进行类似反馈。我们可以把这两种互动理解为针对用户提问和直播行为的实时互动能力。
  • 引导话术:虚拟主播会间隔一定时间说一些邀请关注、分享、下单等常规互动话术引导观众进行相关转化。
  • 才艺表演:还可以间隔一定时间表演才艺(讲笑话和跳舞)来活跃直播间氛围。
  • 游戏互动:虚拟主播甚至能够与直播间观众玩互动游戏,主要有猜拳游戏和帮助主播换装游戏等选择类游戏,游戏时画面里会出现小弹窗,用户点击相关选项即可参与游戏,这大大提升了与观众的互动能力,让观众有兴趣有期待,从而提升留存和转化。我们可以把这三种互动理解为活跃直播间气氛的定时互动能力。

系统也会进行一些反馈,系统可以根据脚本设定定时推送优惠券和关注弹窗,提示用户点击形成转化。由于直播少了很多真实性和互动性,推送优惠券这种利益因素对于用户停留和转化非常重要。而推送关注弹窗引导用户产生即时的关注行为,则将流量沉淀建立客户关系;

此外,系统还可以反馈用户文字提示,比如评论区要求介绍x号上商品,主播不会立即插播,这时系统会反馈文字提示“稍后将为您讲解x号商品”,避免中断当前内容并缓解观众的等待焦虑。

小结:

我们从虚拟内容生成、虚拟内容展示、直播互动等三个方面分析可以看到淘宝智能直播系统依然是紧扣人(人物表现)、货(货品展现)、场(场景互动)来进行构建的,是现实内容现实场景到虚拟内容虚拟内容的映射,更借助平台的数据能力实现直播内容智能生成、智能互动。通过诸多功能模块的设计向用户提供直播内容价值、体验价值、互动价值,进而推动商家的销售转化和关注转化。

智能直播在很长一段时间应该都不会是直播主流,但却为更广阔范围的的虚拟内容制作和传播提供了实践意义和方向指引。

四、对于智能直播间各方态度如何?

对于这样一款智能直播产品各方的态度又是如何呢?

1. 商家态度

对商家来说,最重要的还是转化,首先是销售转化,其次是关注转化,只要能带来转化的合规产品都值得尝试。智能直播能够降低直播运营成本(主播人力、运营人力、直播技术成本),有效避免直播事故和真人主播失误等隐患,尤其是对于医药和保健品等对主播专业要求和直播规范较高的品类,虚拟主播更有其应用意义。

商家们可以充分利用真人直播空闲时间,提升24小时商品售卖能力和品牌宣传力。尤其对于刚开始做直播的中小商家,利用虚拟主播长时直播进行产品宣传推广提升浮现权和沉淀流量来说,还是非常值得一用的。对于大品牌商家,如果拥有自己的ip形象,将其放到电商场景为自家代言带货何乐而不为。

不过在转化能力上,虚拟主播距离真人专业主播还差很多,而且机械感互动弱也有造成用户流失的风险,这也是很多商家顾虑的地方。

2. 平台态度

目前只有淘宝平台力推自己的智能直播间产品,而京东、抖音等其他电商直播平台对这种智虚拟主播直播态度较为消极,京东甚至明文规定“不得机器人直播”。确实,虚拟主播一定程度会干扰直播带货环境,它无法达到真人直播的效果却以极低成本与真人主播争夺流量,如果平台中虚拟主播占据大头那会很影响用户观看体验,削弱用户活跃度降低平台吸引力。

所以对平台来说,优质专业的真人主播依旧是直播带货的主力,而虚拟主播在很长时间里依旧会是真人主播的“替代品”,虽然成为不了流量收割机,但也是重要的闲散流量收集器。

3. C 端用户态度

对于日益增多的虚拟主播,大多数用户还是感觉比较新鲜的,会短暂停留和提问,如果不能获得反馈和互动则会退出直播间。也有部分用户对虚拟主播较为反感,评论区中偶尔会看到用户发表不满的意见。进入直播间的用户基本上是有一定的购买意向的,一方面想清晰直观的了解产品细节解答疑问,一方面为了获取直播优惠。所以如果虚拟主播只单纯播报而缺乏互动,是非常影响用户体验和用户留存的。

五、智能直播间产品设计思考

对于智能直播间产品,我们依然可以围绕人、货、场的角度来思考产品应当提供什么样的能力和价值来服务用户。

1. 虚拟主播

1)主播表现更真实

智能直播间的一大痛点是虚拟主播真实性。样貌的真实只是皮毛,最重要的是语言、动作、情感的真实。为什么那么多人喜欢撩siri等语音助手?尽管它没有具体形态,但是它的语言表达和互动是十分接近真人的,甚至具备“人格”,会抖机灵会卖萌。

对于虚拟主播来说,接近真实是更困难的,因为用户既可以听到还可以看到,语言、表情、动作需要精准协调才能生动自然,处理不好的话甚至会让人觉得诡异和机械。所以虚拟主播说什么话对应什么表情和动作都是需要算法大量训练的,尤其是直播场景主播表现力非常重要。需要整理总结真人主播的表现要素、不同直播话术需要的表现要素,再抽象转化到虚拟主播身上,放大虚拟主播形象特质弱化违和感。其中口唇拟人化、表情生动性、动作自然度流畅度、语言节奏、语气起伏、服饰贴图质感等都是需要着重考量的地方。

2)问答互动更智能

直播最大的特点是实时性互动性。真人主播可以做到有问必答、针对性回答,对于不好的反馈可以巧妙规避,甚至利用提问再次强调卖点。这个对于虚拟主播是更难的,它要求虚拟主播拥有像人一样的思维,能够进行判断能够趋利避害会讨好、服务用户。而且直播是一对多的互动,如何做到让所有人都满意呢?

  • 增强评论分析能力:评论的有效性如何判断?有效的评论中哪些是高优的哪些是低优的?能否通过评论内容探知用户情绪?如何平衡商家的问答需求?对于重要的评论内容是否需要及时通知商家获取支持?等等这些问题都需要广泛应用积累数据训练判断能力,可以建立面向不同品类甚至面向不同商家的评论分析模型,提升评论分析能力挖掘评论价值。
  • 健全回复策略:与语音助手一对一多轮对话不同,直播场景更复杂,首先商品介绍和问答互动数重孰轻可能每个商家的需求都不一样,比如有的希望及时回复用户问题,有的希望集中回复降低对介绍内容的干扰。其次在回复形式上,主播语言回复和文字提示回复如何平衡如何表现,回复时是否需要重复介绍一些商品内容,回复内容的精度如何把握?所以面对不同场景应该设计多种回复模式,并结合商家需求和实际场景智能地选用回复策略。
  • 关注用户体验:观看直播的用户有更强的购买意愿,反馈是否及时准确决定着用户的去留。对于以及回答不了问题时,可以说“我还在学习中”此类话术安抚用户;无法及时回复的问题,可以显示延后回复提示安抚挽留用户;在回复能力尚不完备的时候,或许可以用一些替代方案,比如主播会说“你可以这样【问法】问我”,让用户按照规定的方式提问提升回复率优化体验等等都值得我们深入思考。

3)形象类型更丰富

当前淘宝直播间的主播形象还是以成人的卡通类型为主,比较单一,其实形象的丰富度非常重要。对于儿童产品,儿童、动物形象可能会更讨喜,买JK服饰的用户可能更喜欢二次元形象,潮流服饰商品需要的主播形象也应该更酷更潮,头部主播可能更需要模型更加精细的超写实虚拟化身…诸如此类,虚拟主播不只是用来介绍商品,更是品牌特质、真人主播特质的象征。

此外随着使用虚拟主播商户的增多,简单的换装已经难以满足需求,否则很容易出现“撞主播”的尴尬场面,需要跟进形象自定义捏脸塑造、素材自定义更改调整及与品牌商品融合等功能促进主播差异化。

2. 货品展现

1)信息传达更精准

目前的方案基本都是整合商品相关的图片、视频信息辅助讲解,但是这些信息没有和介绍内容对应起来,视听并不统一节奏混乱。所以在商品内容生成上,需要使商品图片/视频信息在与介绍内容精准对应,让信息传达更直观。比如讲解到某局部,就应该出现该产品局部的图片,并且对关键信息运用视觉手段着重表现。

在展示布局上,需要放置于直播间视觉中心位突出商品信息,并恰当的融入虚拟环境;

2)商品展现更真实

智能直播间另一大痛点是货品真实性。真人主播可以全方位展示商品细节和使用效果,但是虚拟主播不能。所以需要继续探索更多的商品展现方式,比如模拟真实使用环境,让产品图与环境的融合度更高,增强观看的沉浸感;或者放置一个虚拟展台借助环物摄影技术,360度还原展示商品原貌和细节,让用户尽量多的了解商品细节甚至可以放大查看;或者运用VR技术与设备,让用户自主地更全面地了解商品甚至模拟试用。

3. 场景互动

1)场景设计智能化

如果说相对真人直播,虚拟直播有什么优势的话,虚拟直播间场景的低成本、丰富性可以算一种。纯虚拟场景没有直播间搭建的成本,虚拟主播和多样的场景可以完美融合,提供更丰富奇特的视觉体验。但目前的场景设置千篇一律,与品牌、商品内容关联度极低毫无亮点,如果全交由商家,又很考验商家团队的设计能力增加了成本。

之后可以对直播间场景的智能化设计有更多探索,应对不用的商品类别有不同的视觉风格,商家只需要导入相关展示素材即可自动排版布局,并参照文本内容动态变化,甚至可以参考直播受众的审美喜好千人千面直播间场景。还可以增加景别变化,丰富用户视觉体验。此外商品本身也可以作为一种场景,展示内外各种细节,让用户更全面地了解。

2)场景互动更丰富

场景能力不仅仅是视觉展现,更重要的是互动性。活跃的直播间气氛对用户有着较强的吸引力,将直播间从带货场景升级为娱乐、社交场景或许是一条值得深挖的道路,这也是智能直播间的差异化优势。现有的诸如表演才艺、游戏互动、换装互动等定时互动内容都是活跃直播间氛围丰富互动体验的较好案例。或许未来可以借助VR设备,身临其境地与场景互动,与虚拟主播互动,甚至与其他直播间观众互动。

4. 小结

笔者借由人、货、场的关系将产品能力和价值进行梳理,除了前文提到的虚拟内容生成能力、虚拟内容展示能力、直播互动能力,又新增了内容分发能力,以满足直播和视频分发等更为广大的传播场景。在产品能力与价值矩阵中,所有的产品能力都是为了传递产品价值,并最终转化为商业价值。进行产品设计时应当站在直播间用户需求进行设计考量并平衡商家的转化需求。

六、智能直播间产品未来发展

虚拟内容创作工具,支持全链路全场景。

智能直播间面向直播带货场景,但是纵观直播链路,最终的直播展现只是环节之一。直播前选品、准备、预热、直播后亮点集锦、数据分析等也都是非常重要的环节。虚拟主播作为与用户的沟通媒介,如果能做好播前宣传预热,播后客户维护回访,那就有可能成为真正的产品代言人用户服务者;智能直播间产品如果能够贯穿全场景成为虚拟内容制作工具,为用户打造虚拟空间,制作分发各类虚拟内容,让虚拟带货“活”起来,那将是非常值得期待的。

从带货场景出发走向元宇宙广阔天地。

智能直播间融合了虚拟形象、声音、语言、文字、图片、动画、商品等多种要素,并且可以实时识别、理解、生成、反馈,多种AI技术在直播场景的落地应用,不仅是满足了业务层面的需求更是元宇宙探索的一个试验场。近期被热炒的元宇宙概念,其实就是将真实世界在数字世界里的映射、复刻。而直播带货这一商业价值巨大,普遍、复杂且重要的场景如果最终能转化成真正的智能直播间,那其技术和产品的拓展应用潜力是巨大的,可以为元宇宙等诸多领域应用提供参考。

 

本文由 @大王叫我去巡山  原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于 CC0 协议

给作者打赏,鼓励TA抓紧创作!
更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. “对平台来说,优质专业的真人主播依旧是直播带货的主力,而虚拟主播在很长时间里依旧会是真人主播的“替代品”,虽然成为不了流量收割机,但也是重要的闲散流量收集器。” 这点正是当前很多虚拟主播面临的瓶颈。虚拟主播想要真正获得更大的价值,绝对不仅仅是去收割真人主播覆盖不了的闲散流量,去成为真人主播的替代,而是还需要挖掘出虚拟主播不可替代的价值,能在某些点上比真人做的更好。

    回复
  2. 虚拟主播能做到有问必答、针对性回答,规避不好的反馈吗

    回复
  3. 虚拟主播有一点好的就是有字幕,可以让人更直接地找到内容。

    回复
  4. 虚拟主播带货我从消费者的角度来看说实话挺无聊的,回应也不够恰当,跟AI智能被吐槽的原因是一样的,分不清是人工智能还是人工智障

    回复