数据分析误区系列(五):因果陷阱

0 评论 587 浏览 1 收藏 6 分钟
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

做数据分析时,如果提前知道一些常见的误区,能提高我们不少工作效率。本文分享的因果陷阱这种概念,能帮大家避免此类误区。

做互联网应用运营同学经常会遇到这样的问题,当增加广告或者发放更多的优惠券时,最终订单支付率也会增加,两者之间的相关性很高

例如:

(a)在广告投入每增加10%,支付失败率从10%增加到15%。

(b)在广告投入没有增加的时候,支付失败率维持在10%。

因此就推断可能是增加广告投入导致了支付失败率的增加。

尽管数据显示了广告投入和支付失败率之间的高度相关性,但这并不能确定广告投入就是支付失败率增加的原因。实际上,增加广告投入可能吸引了更多的新用户来到网站,而这些新用户对网站的产品和购物流程不熟悉,导致支付失败率的增加。其实”关联并不意味着因果关系”。我们不能仅仅因为两个变量之间有关联,而直接断定它们之间存在着因果关系。这就是常说的“因果陷阱”。

类似:在一份关于气候变化的研究数据中,科学家发现,过去十年来海盗数量的减少与全球气温的升高呈现高度关联性。那么,我们能否因此得出结论:减少海盗数量会导致全球气温升高?显然,这种因果关系是荒谬的,注意,这就是不正确理解数据的结果,也是因果陷阱的一个典型例子。

让我们再来看一个更生活化的例子。一个常见的说法是“撒娇的女人更好命”。假设我们有一份研究结果显示,撒娇的女人通常比不喜欢撒娇的女人更好命,这里的“好命”可能被定义为更幸福的生活或者更高的生活满意度。然而,这并不能说明撒娇就是导致“好命”的因素。

首先,可能存在第三个变量,比如财富状况或自信心,这些变量可能既影响女人是否撒娇,又影响其“好命”的程度。例如,一个更自信或者更富有的女人可能更可能毫无顾忌地撒娇,同时也很可能由于这个原因,拥有比较满意的生活。

其次,这种关联可能是反向即反事实的。也就是说,因为女人具有更好的生活,她们才有幸福感、自信心去撒娇。换句话说,“好命”引发了撒娇,而非撒娇导致了“好命”。

只看到“撒娇的女人更好命”的表面现象,而不深入分析其背后可能存在的机制,便很容易陷入因果陷阱。我们可以通过更深入、全面的研究,并计算各种影响因素的控制变量,来更准确地理解这个现象。

在数据分析过程中,我们需要注意的是:关联性是可以量化的,但是因果性则需要通过科学的实验设计和深入的思考来确定。统计学中,Pearson相关系数是一种衡量两个变量线性相关程度的量,其取值范围在-1到1之间,值越大关联性越强,但是这并不是说它们之间就存在因果关系。

比如,我们经常看到夏天冰淇淋的销售量与溺水事件的增多有很高的相关性,但是我们并不能说冰淇淋的销售增加导致了溺水事件的增多,这是因为他们的增加都是由炎热的天气因素引起的。

数据分析不仅仅是看数字,理解数据。更重要的是要精确地理解和分辨关联性和因果性,避免陷入因果陷阱。豁然开朗的数据洞察,并不是拿到数据就能获得的,需要我们深度思考和尖锐洞察。在这个数据泛滥的时代,正确理解数据,避免因果陷阱的误导,就是我们每一个数据分析师的使命和责任。

本文由 @佑佑和博博~ 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
101900人已学习23篇文章
做产品难,做运营更难,做APP运营推广难上加难。
专题
16105人已学习13篇文章
生活中,我们会看到路标、指示面板、箭头指引诸如此类的常见的导航,其实网络中也有很多导航指引。导航有什么用呢?导航设计又要遵循什么规范?本专题的文章分享了导航设计指南。
专题
13039人已学习14篇文章
现在,不少企业和行业都走上了数字化转型的征程。本专题的文章分享了数字化营销策略。
专题
11615人已学习12篇文章
本专题的文章分享了情人节的营销思路。
专题
37867人已学习22篇文章
复盘是产品经理和运营人提高自身竞争力的不二法门。