数据分析必须警惕的坑：辛普森悖论

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

数据分析必须警惕的坑：辛普森悖论

韩进

2018-06-15

8 评论 33382 浏览 124 收藏

9 分钟

辛普森悖论为英国统计学家E.H.辛普森于1951年提出的悖论，即在某个条件下的两组数据，分别讨论时都会满足某种性质，可是一旦合并考虑，却可能导致相反的结论。

近些年来，随着大数据行业的蓬勃发展，“Data-Driven（数据驱动）”受到越来越多企业的追捧。越来越多场景的数据采集、越来越成熟的分析模型、越来越强大的分析效率，这些无疑都是精细用户行为分析、优化决策体系的智举。

然而在数据背后，隐藏着一些似是而非的谬误，比如“辛普森悖论”，作为数据分析人员必须警惕。

悖论出处：

辛普森悖论为英国统计学家E.H.辛普森（E.H.Simpson）于1951年提出的悖论，即在某个条件下的两组数据，分别讨论时都会满足某种性质，可是一旦合并考虑，却可能导致相反的结论。

一所美国高校的两个学院，分别是：

法学院和商学院，新学期招生。人们怀疑这两个学院有性别歧视，现作如下统计：

从上图显示的数据我们可以看到，法学院男生的录取比例为8/53=15.1%，女生录取的比例为51/152=33.6%。同理，商学院男生的录取比例为80.1%，女生的录取比例为91.1%。

无论在法学院还是在商学院，女生的录取比例都高于男生，由此可以推断学校在招生时更倾向于招女生吗？

当计算全校录取情况时，男生录取的比例为209/304=68.8%，女生录取的比例为143/253=56.5%。男生的录取率要高于女生，这下，恐怕要轮到女生感到不公了。

那么问题来了：该大学的招生政策，到底有没有性别歧视？到底是歧视男生还是女生？

先不说结论，我们再来看一个实际工作中会遇到的案例。

工作中的典型案例：

某产品的用户中有10000人使用Android设备、5000人使用IOS设备，整体的付费转化率应该是5%。细分发现其中IOS设备的转化率仅为4%，而Android设备则是5.5%。“聪明”的数据分析师得出结论：IOS平台的用户付费转化率低下，建议放弃IOS平台的研发。

一般来说，IOS平板的付费转化率比Android平板高出很多，而IOS手机的转化率也相对更好。这种情况下，设备类型就是复杂变量，如果数据是根据设备类型得到，那么其他的数据就可能被完全忽略。

接下来我们来对比这一组数据：

由此可见，Android设备转化率无论在平板端还是在手机端的转化率都小于IOS设备，这也很我们的常规预期相符。

当计算全设备情况时，Android的转化比例为550/10000=5.5%，IOS的转化比例只有200/5000=4.0%。这也是题干中“聪明”的数据分析师得出IOS版本应该下线的根源。

原因与应对策略：

误区产生的原因说起来也很简单，就在于将“值与量”两个维度的数据，归纳成了“值”一个维度的数据，并进行了合并。

如果要避免“辛普森悖论”给我们带来的误区，就需要斟酌个别分组的权重，以一定的系数去消除以分组资料基数差异所造成的影响。而在实际转化例子中，就需要用如“ARPU”、“ARPPU”这样看似相似实际上有很大差异的指标来进行分割。

同样地，如果要更客观分析产品的运营情况，就需要设立更多角度去综合评判。还是拿上述的设备转化率为例，产品层考虑转化的前提会优先考虑分发量、用户量、运营思路、口碑等等。而往往为了实现最后的转化需要，需要更多前置目标做铺垫。

常用的前置目标：

用户量：免费产品需要很大的用户量才能获得足够的总收入，因为该模式的转化率极低。而这些用户通常来自全球各个地区，使用各种不同类型的设备。针对不同的设备类型，采用通用的平均值是没有意义的。
LTV范围：免费产品需要很长的货币化周期，把用户消费当作玩家是否开心的依据，就像参与度和消费紧密相关一样，因此可以作为分类的标准。

大多数的用户是不会付费的，免费产品的综合付费转化率比较低，是因为把付费玩家和非付费玩家综合到了一起，所以任何对免费用户的衡量都是非常低的。因为大多数的用户是不付费的，所以ARPU以及ARPPU相差很多。

A/B测试中的注意点：

联想到产品运营的实践，一个常见的A/B测试误判例子是这样的：拿1%用户跑了一个重大版本，发现试验版本购买率比对照版本高，就说试验版本更好，我们应该发布试验版本。

而事实上，我们选取的试验组里往往会挑选那些乐于交流、热衷产品、又或者是付费率高粘性高的用户，把他们的数据与全体用户对比是不客观的。当最后发布试验版本时，反而可能降低用户体验，甚至造成用户留存和营收数据的双双下降。

收获与总结：

避免辛普森悖论的关键是要同时参考不同用户间的事实全貌。

第一，准确的用户分群在数据分析中是非常重要的，尤其是在免费产品当中，平均用户不仅不存在，而且是误导研发的因素之一，所以关键在于利用特征将用户进行合理划分。

第二，在一个具体的产品中，普适型的数据（如粗暴的对比IOS和Android总体情况）是没有多大参考意义的，一定要细分到具体设备、国家、获取渠道、消费能力等等再进行比对才有价值。

第三，斟酌个别分组的权重，以一定的系数去消除以分组资料基数差异所造成的影响，同时必需了解该情境是否存在其他潜在要因而综合考虑。

用户分析常用缩略词：

DNU，Daily New Users：每日新增用户
AU，Active User：活跃用户，统计特定周期内完成过指定事项或指标的用户数
PU，Paying User：付费用户
APA，Active Payment Account：活跃付费用户数
ARPU，Average Revenue Per User：平均每用户收入，总收入/AU
ARPPU，Average Revenue Per Paying User：平均每付费用户收入，总收入/APA
PUR，Pay User Rate：付费比例，APA/AU
LTV，Life Time Value：生命周期价值

作者：数数科技，公众号，数数科技（ThinkingData）

本文由 @数数科技原创发布于人人都是产品经理。未经许可，禁止转载

题图来自 Pexels，基于 CC0 协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

韩进

创新创业爱好者

4篇作品 188447总阅读量

10分钟骗走430万，如何提防诈骗新技术？

05-261428 浏览

京东“低价”这一年

12-213630 浏览

从0开始设计产品搜索功能（三）

09-254879 浏览

智能化监控告警系统：基于物联网移动网络通信服务平台的设计与实现

05-118233 浏览

微软“核弹级”更新：ChatGPT亮相Bing搜索和浏览器，今天上线，免费使用

02-086663 浏览

小鑫

看完了，还是不太懂。比如为什么A渠道进来的用户留存率增加，B渠道进来的用户留存率也增加，那为什么统计A+B渠道的留存率却会下降呢？

最近来自浙江回复
止

其实就是不要用部分属性数据当做全属性数据的结果！

最近回复
1. 韩进作者回复止
  
  哈哈，解释的简单明了。
  
  最近来自上海回复
2. 止回复韩进
  
  哈哈
  
  最近来自福建回复
不卖羊毛的阳阳阳

请问LTV怎么操作衡量，例如哪些指标？谢谢

最近回复
1. 韩进作者回复不卖羊毛的阳阳阳
  
  LTV对各个行业、不同产品测算方式差别比较大，简单来说有假设性计算和预测性计算。假设性计算基于以前产品经验、行业用户消费情况经验等，对高消费、低消费人群的消费习惯进行数据推算；预测性计算可以通过收集用户信息，进行用户分群，对不同分群用户的留存率、留存时长、留存期内消费进行计算，并推测后续变化。因为现在很多商业模式的营收依靠的不是用户的直接付费，但不代表着免费用户就没有价值，需要将创造营收的业务模式拆解后进行部分倒推测算。下次文章尽量找个行业举例来描述一下。
  
  最近来自上海回复
听颜的唯桀

学到了。
但iOS的写法错误了，纠正一下

最近来自广东回复
1. 韩进作者回复听颜的唯桀
  
  谢谢！
  
  最近来自上海回复