网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

11 评论 2743 浏览 19 收藏 10 分钟

编辑导语:在网易云音乐平台,经常能发现一些冷门但好听的宝藏歌曲,这是网易云音乐的差异化优势。网易数据产品团队是如何通过定义音乐鉴赏人,实现对小众高品质音乐的批量挖掘和冷启动呢?一起来看一下吧。

01 长尾内容信号缺失,如何发掘其中的优质内容?

作为网易云的资深用户,我在网易云上面发现了不少冷门但是真的很好听的宝藏歌曲。宝藏小众歌曲推荐算网易云音乐的差异化优势,在其他音乐平台很少见到。

今天和大家分享冷门宝藏歌曲背后的故事,看看网易数据产品团队如何通过定义音乐鉴赏人,实现对小众高品质音乐批量挖掘和冷启动

首先聊聊为什么大部分情况下我们听不到小众歌曲。站在推荐算法的角度看,因为长尾内容用户行为数据较为稀疏,算法误判的概率很大,误判后推荐一些人气低而且不好听的内容,是对用户体验非常大的伤害。

所以一般情况下,算法会更偏好推荐热门内容,因为数据量充足置信度高。这会让整个平台追求确定性的中低收益,但这样会导致畸形的生态和音乐口味的趋同。

长尾内容:可以理解为小众,冷门,对人群的渗透率低的内容。长尾是指在概率分布图的尾巴位置。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

而着重推荐成熟歌曲的算法对新晋创作者很不友好,这样的机制会让新作品和细分圈子的小众作品得不到流量的青睐,没有露脸的机会,自然无法出头。而站在平台侧的角度,如果新内容无法很好冷启动,流量总是集中在头部热度高的歌曲,对于长期健康内容生态是很不利。例如快手就因为几个直播家族流量过于集中,平台议价权被挤压,以及头部暴雷对生态打击严重。

为了保持高质量的音乐生态,给宝藏小众歌曲更多机会,网易云团队一开始的方法是人工捞取小众歌曲听,根据好听程度打分,把得分高的小众歌曲交给算法去推荐。但是人工成本高,效果挺差,因为打分人很主观,他们的音乐喜好并不能代表听歌用户,体现在数据指标上是人工筛选的歌曲冷启动成功率(播放等级跃迁成功率)有3%。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

所以网易团队开始用数据产品的方式来解决这个问题,问题的成功指标是:

  • 短期:小众高质量歌曲的冷启动成功率
  • 长期:音乐流量分布健康,不过分集中于头部

02 先(用数据)找伯乐,再找千里马

小众歌曲的投票权,不应该集中在审核人员,而是应该下放到广大听歌的人民群众手中。用良好品味和代表性的听众的投票行为,来作为高质量音乐的信号,传递给推荐系统。找到高质量音乐鉴赏人十分关键。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

音乐鉴赏人的典型画像是这样的,深夜emo的你,打开网易云,恰好听到一首小众冷门的歌,但是越听越好听,你点亮了小红心,一遍又一遍的循环播放,这点黑夜里的点赞小火星被推荐系统敏锐的捕捉到,让枯竭的流量之水开始流淌,最终让这首埋藏已有的歌得见天日。

那如何用数据发掘音乐鉴赏人呢?

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

音乐鉴赏人是能在高质量歌曲早期就点赞收藏这些音乐的人:

  • 发现时间早:「发现歌曲时间权重分」,对用户收藏某首歌曲的时间先后进行加权处理。在某首歌曲播放到达最高等级的成长周期中,对歌曲进行较早收藏的用户得分更高,以表现该用户更好的鉴赏能力
  • 升级幅度大:计算当前歌曲等级(ground truth)与收藏时等级差值、播放次数差值,找出收藏行为对应的后验热度Lift

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

定义音乐鉴赏人时,要注意到在国风音乐鉴赏能力强的人,不见得能鉴赏英文Rap。所以音乐鉴赏人也需要分类,按照音乐垂类划分,例如摇滚、R&B、日语、电子、民谣乡村、爵士古典等等,给各个音乐鉴赏人在这个音乐垂类进行打分。

结果:音乐鉴赏人成功地发现了许多优质小歌,这些小歌被扶持后的冷启动成功率(播放等级越迁成功率)超过40%,比例远高于之前人工打分的3%。优化了平台生态和长尾内容捞取不足的问题。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

网易云团队还提供了个品鉴人发现小众歌曲的栗子:「多喝热水」这首歌自上线以来长期处于只有极少数人在听的状态,4月3日被鉴赏者发现并红心收藏,鉴赏者对该歌曲的背书被算法立即识别到,进行流量扶持分发,之后退出扶持再让其自然成长。经过2-3天的加量扶持后,歌曲有了一定的人群受众,之后逐渐快速成长,因各项指标一直良好,被算法再次加量扶持,最终冲上了站内排行榜。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

网易云是通过研究小众歌曲的走红,找到了音乐鉴赏家,实现对更多小众歌曲的高效发掘。通过数据实现内容找人,人找内容,是数据产品的常见核心实践。

Web3.0的数据公司Nansen旗下的数据产品Nansen.ai也是如此,通过对交易记录的分析,给部分钱包地址打上了“smart money”的标签。这些地址在过去的交易中低买高卖,收益颇丰,地址背后往往是懂行且信息多的Crypto fund,smart LP等“聪明”的机构和个人投资者。

网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐

用户在寻找和研究区块链项目时,可以看这些smart money买了哪些,买了多少,什么时候入场,跟着聪明的人走,比自己摸着石头过河要好一点。

03 延伸思考

网易云的音乐品鉴人可以考虑在C端产品上公开,变成鼓励用户的荣耀机制(例如 “古典音乐专业品鉴人”认证)。也能放到网易云的年度报告里面。告诉用户这一年帮助多少小众歌曲被更多人发现,是一件很有价值的事情。

公开后,也要防止品鉴人的认证信息对用户行为造成扭曲。上面举的nansen的例子中,nansen.ai公布了smart money后,会有项目方向smart money地址直接发币,营造出站台的假象,这些都造成了一定程度的信息扰乱。需要进行规则打压和治理。

 

本文由 @元小浩Yohann 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 网易云确实是小众音乐爱好者的天堂哈哈哈哈哈哈

    来自陕西 回复
  2. 不得不说,网易云这个APP有时候真的是让人爱不释手,还有每次节日的H5疯狂刷爆朋友圈。

    来自河南 回复
  3. 不得不说网易云的大数据还是很不错的,尤其是使用体验让用户觉得很棒

    来自山西 回复
  4. 以前用网易云是里面的氛围好点,现在离不开是因为用户推送每次都让人很惊喜

    来自山西 回复
  5. 网易云的用户推荐我太喜欢了,有很多以前听过的歌想不起名字也可以推送过来

    来自山西 回复
  6. 以前是用酷狗,刚开始用网易云是冲着它的评论来的,现在好喜欢网易云,给我推的歌都是我喜欢的

    来自广东 回复
  7. 我觉得网易云根据用户风格推的歌单就很不错啊,推给我的歌单风格都是我喜欢的

    来自广东 回复
  8. 很多自己喜欢的宝藏歌曲根本不想它走红,有些歌一旦走红以后就会产生听觉疲劳

    来自广东 回复
  9. 很有意思的分析!感谢作者分享!

    来自天津 回复
  10. 网易云虽然大热歌的版权不多,不过在小众音乐这块储备量还是蛮大的。

    来自江苏 回复
  11. 看了文章后了解了很多,原来推送给用户的宝藏小众音乐背后也立足于数据。

    来自上海 回复