数据扫盲(2):新增用户与留存到底是啥?

15天0基础极速入门数据分析,掌握一套数据分析流程和方法,学完就能写一份数据报告!了解一下>>

对数据基本功的扎实了解,是沟通的桥梁,本文作者对常见的数据指标进行了分析,希望通过此文能够加深你对基础数据指标的认识。

01 新增用户

如果大家看过咱们系列的第一篇文章:《数据扫盲(1):我们常说的DAU、MAU是啥?》应该是知道这样一句话:

对数据基本功的扎实了解,是沟通的桥梁!

这句话是贯穿我们数据扫盲系列始终的,跟着新增用户我们举一个场景,大家可以再次深度感受一下这句话。

我们的运营同学为了推广app,去找渠道商进行合作,涉及到结算钱的时候,商量以新增用户为指标进行结算,但是对于新增用户的具体定义,大家发生了争执:

  • 渠道商:只要用户在我们渠道的推广页面点击了产品下载按钮,就记作一次新增用户。
  • 运营喵:那不成,点了按钮没下载那意义不大啊。咱们下载成功记作一次新增,且多次点击记作一次。
  • 产品狗:错了错了,咱们app这么牛,至少也要启动一次记作一次,让他们体验下,要不然数据质量不大,不具备参考价值。
  • 工程狮:都打住啊,你们这yy半天不行啊,不注册我们后台都没有数据。必须注册了才算新增用户。

面对这样的场景,我们很难去说对错,我们更关心的是彼此间对于数据指标如何达成共识!

那么新增到底指的是什么呢?

我们把新增用户进行说文解字般的拆解,新增=新+增。接下来我们需要明确两个问题:

Q1:什么是增?在哪个节点为增?

A1:一般来说,在用户与产品发生关系之前,往往会经历如下图所示路径:

用户通过不同的渠道衔接进入到渠道页(例如某度广告页,某企鹅广告页);用户在渠道页面点击下载或者通过渠道页进入到应用商店下载;安装,启动应用,来到应用首页;触发相应的激活行为(不同业务激活行为不同,例如注册成功、购买商品、亦或是观看一次视频等等)。

理论上不同的节点,都是可以作为一次新增,这里呢,我总结一下不同节点作为新增的优劣势,以及适合的场景。

大家就可以根据表中总结的,结合自己公司业务选择适合自己的节点。

Q2:怎么判断是否为新?

A2:这个问题是由一个实例引入的,假设我们以安装启动这个节点作为增,一个用户下载了某app并安装启动,装了两天卸载了,又重新安装启动,此时他是否算作新增用户?这里,我们一般有两种判断方法:

  1. 基于设备:用户第一次安装启动时,记录设备。再次安装则不记录。其中涉及的不同系统之间(ios,安卓,web)判断设备的门道,详情细节可见上一篇文章《再也不怕别人问我DAU和MAU了》其中关于user部分的介绍。
  2. 基于账号关联。

以账号作为判断基准,和后台已有的账号进行比对,看以前是否存在此账号。

02 留存用户

本文提到的留存都是指的新增用户的留存,下不赘述。

首先我们来看一下友盟平台对于留存是怎么下定义的。

宋老湿还是给大家引入一个案例,来帮助大家理解定义。

案例还是一款悲催的app,上线第一天新增了100名用户,之后就再也没有获取新增用户。下面给出其上线七日的日活表:

我们由表可以得出MAU=100,这点如果有疑问,请查看数据扫盲系列文章一《再也不怕别人问我DAU和MAU呢~ 数据扫盲系列(1)》。

问题:如何计算新增用户七日日留存?

这里给出两个算法。

算法一:(第七天留存用户数/第一天新增用户数)*100%

算法二:(第二天~第七天去重后的留存用户数/第一天新增用户数)*100%

根据留存的定义,“某段时间内的新增用户,经过一段时间后,仍继续使用应用的,为留存用户”。从中可以提炼出留存用户是某段时间新增用户的子集。

就本题而言,上线第一天新增了用户100人且之后再没有新增用户,所以第一天之后几天的活跃用户都是第一天新增用户的子集,即第X日留存用户数=第X日活跃用户数,第一天的新增用户=第一天的活跃用户。

但是,如果没有“第一天新增100人后再无新增用户”的前提,则第X日留存用户数≠第X日活跃用户数,准确表述应为第X日留存用户数=第X日来自于第一天新增用户中的活跃用户。

这里有一点绕,我举一小例子帮助大家理解一下。

(假设5月份新增用户200,这200人在6月份启动过应用的有100人,7月份启动过应用的有80人,则6月份留存用户为100人,7月份留存用户为80人。)

那么采用哪一个算法呢?

如果您有心记得,宋老湿反复强调过:数据分析一定是基于业务的,是有目的(即留存用户这个数据指标的意义)。

目的一般来说,留存的计算与分析有以下目的:

  1. 观测不同渠道带来用户的质量;
  2. 版本更新后的新功能上线的效果反馈。(功能这一块,会涉及到用户关键行为的触发。属于精准留存的问题,后期文章我们会讲解)

此处我们以区分渠道质量来做讲解:

算法一

假设某app有两个获客渠道A和B,且都是1月1日上线,当日新增用户100名之后再无新增用户。已知两个渠道1月1日~1月7日每日的活跃用户的数量,用算法一【(第七天留存用户数/第一天新增用户数)*100%】计算分别得到两个七日留存率。

这里可能会有一些朋友会觉得,用算法一计算忽略了2日到6日的用户数据,这样计算得到数据不准确。其实不是这样的,我们获取了两个数据是为了进行数据对比,从对比中洞察业务爆破点。因为无论是渠道A还是渠道B,我们都只使用第一天和第七天的数据,同时忽略了2日到6日的数据,忽略的信息是一致的。

因为单一影响因素相同,所以采用算法一计算进行对比是相对公平合理的。

当然,即使这样,可能还会有一些朋友会问那有什么办法不忽略2日到6日的数据呢?

算法二

【第二天~第七天去重后的留存用户数/第一天新增用户数)*100%】这种计算方式就是把2日到6日之间的活跃用户计算在内,但是这样的计算方法是否适合用来评估渠道质量呢?

我们可以看下下图是关于渠道A和B七天日活用户的折线图,我们严格按照算法二计算会得出渠道A留存率高于渠道B,实际上我们由图可以看出渠道B的活跃用户曲线更接近于自然平缓下降,同时第七日的活跃用户也高于渠道A。综合来说渠道B的用户质量是高于渠道A。

所以用算法二来计算留存评估渠道质量是不ok的,究其原因,恰恰是引入第二日和第六日的数据,反而影响了结果的判断。

通过以上的案例,大家应该理解了两者的区别。

算法一我们可以称之为七日日留存,算法二为七日内留存。

当然,存在既有合理性,算法二并不是没有适用场景,针对一些用特定使用周期的app就更适合,例如某app是专注于周末轰趴,活跃用户大部分聚集在周六和周日,我们如果去计算工作日(周一至周五)任一天的新增用户七日日留存,会发现明显偏低于周末。

针对这种情况,我们只看第七天的日留存显然不能反应真实情况,反之,关心七日内的留存就更为真实可靠。

那么,宋老湿还是以友盟数据平台一组七日留存的表格,大家可以尝试看下友盟采用的是算法一还是算法二。

有些朋友可能有些摸不到头脑,有些朋友直觉可能觉得友盟用的是算法一。实际上,友盟平台计算方法和算法一很相似但有些许不同。我们暂且称之为算法三。

算法三

(第七天的留存用户数/第0天的新增用户)*100%。

这个第0天其实指的就是计算留存的当日,和算法一中的第一天指的是同一天。如上图所示,如果计算2018—08—01的七日日留存,则算法一中的第1天和算法三中的第0天都是指的08-01的新增用户数339人。再仔细看上图会发现,友盟统计时采用1天后,2天后对应就是算法一中的第二天与第三天。

那么友盟为什么采用算法三,这样计算有什么好处吗?希望大家动脑子想一下。

(这里给一个提示:和一周七天有关联)。

揭晓答案:这是因为采用算法三我们可以规避星期对数据的干扰。

举一个例子,2018-08-01是星期三,采用算法一的第七天则是08-07星期二,算法三则是七天后08-08星期三,这样同时用星期三的数据,就可以合理规避今日是周几对数据的干扰。

那么我们一共讲了三种算法,每种算法都有其存在的意义,具体的要根据自己公司业务进行选择,保证公司内部采用同一种标准即可。

这里,宋老湿给大家做一个表格进行总结,大家可以保存图片备用。

基于此,新增或和留存咱们是聊得差不多了。大家应该会有种毛塞顿开的感觉。

下一期,具体主题宋老湿可能会继续聊一些数据指标,也可能会聊一些UI设置的基础。敬请期待。

 

作者:宋老湿,公众号:产品经理吐槽喵,一个有温度的公众号 互相学习交流进步

本文由 @产品吐槽喵 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

给作者打赏,鼓励TA抓紧创作!
评论
欢迎留言讨论~!
  1. 期待第三集,什么时候更

    回复
    1. 尽快哦 很开心文章对您有帮助 订阅点赞收藏是我更新的动力 笔芯

      回复
  2. 很棒 小白容易理解

    回复
    1. 如果对您有帮助
      订阅加赞 收藏素质三连来一波

      回复
  3. 优秀

    回复
    1. 互相学习

      回复
  4. 数据小白一枚,期待更新~

    回复
    1. 催更是可以的 订阅收藏加赞不来了三连吗 小姐姐

      回复
  5. 入门,普及的挺好

    回复
    1. 共同学习 谢谢认可 就是普及下数据指标的基础

      回复
圈子
关注微信公众号
大家都在问