做数据十年,这是我见过最好的因果推断模型!

0 评论 92 浏览 0 收藏 9 分钟

做数据十年,这是我见过最好的因果推断模型!从拆解法、相关系数法到随机试验、匹配法(DID/PSM/RDD),一文讲透四种找原因的实战方法。

“到底导致问题的原因是什么!”是新手同学最怕遇到的问题。今天陈老师一次介绍4种办法,从土办法到模型都有!

记下来,以后再不纠结

常见方法1:拆解法

拆解法即:把一个结果指标,从多个角度拆解,差异大的就是原因。

举例:昨天有4个推广渠道,一共获客100,今天只获客80,问为啥获客少了。

(如上图):

把总获客数,按四个渠道拆解,发现A渠道获客最少。得到结论1:因为A渠道少了,所以总获客少了。

把A渠道的获客,按获客流程拆解,拆解为展示页-落地页-转化三步,发现是转化环节少了,得到结论:因为A渠道的转化环节出了问题,所以总获客少了。

总结:因为A渠道转化环节出问题,这是获客少的原因。

看起来回答得很完美,可经不起业务部门的追问:那为什么A转化差了呢?

  1. 我也没改文案呀?
  2. 投放经费也没少呀?
  3. 前后只差1天,为啥差异这么大?

有没有其他可能……拆解法,本质上是通过细分,锁定了问题发生的位置。

并不能找到元凶。所以常常被用来发现问题,而不是解释问题(如下图)

常见方法2:相关系数法

统计学里有相关分析的方法(如下图):

这次有一个复杂的公式做支撑,应该很科学了吧?

但是!这么搞,很容易搞出来统计学领域经典的“龙脉梗”

1、中国GDP年年涨

2、我家门前的树年年涨

3、把两个数据带进去,算出相关系数0.99

4、所以我家门前的树是中国的龙脉!

相关分析,本质上不是“分析”,而是计算。只要两列数字保持相同/相反走势,就能算出来很高的相关系数。

至于这个相关系数在现实中,到底有没有含义,就不管那么多了。

因此,相关分析可以大范围地筛选指标,过滤掉纸面上不相关的,真正的因果分析还要深入做(如下图)

常见方法3:随机实验

从本质上看,因果推断问题难解,是因为有多重因素共同作用。因此要控制其他因素的影响,只测试我们关心的那个因素的影响。

我们可以把影响因素记作X,结果记为Y,分析目标是得出X→Y的效果如何控制影响因素呢?

最好的办法就是随机实验!

随机实验被称作因果推断的黄金法则。只要随机分组做的足够充分,就能生成两个一模一样的个体,剔除其他因素影响。之后,对其中一组施加我们想要的影响,另一组不施加影响。然后观察两组指标差异(如下图)

但是,实际工作中开展ABtest会很复杂,因为需要产品准备不同设计,开发做不同版本,工作量太大。

而且当测试的因素很多时,因素之间可能存在:

1)交叉效应:两个动作同时生效时,产生更好/更坏作用

2)新奇效应:新上功能时大家图好玩,事后又不喜欢了

3)覆盖效应:影响大的把影响小的覆盖掉

4)季节效应:只在特定时期,人们需要这个功能

所以,一定要提前做好功课:

1)到底我测试的X是啥

2)我想影响的Y是啥

3)有没有季节问题

4)有没有重大事件干扰

5)有没有可能多因素交叉

最好是提前做好分析,找到问题最大的点以后再逐一测试

综上来看,随机试验方法很好,但是需要较多前期准备,且可能涉嫌区别对待用户,不太适合在线下开展,更适合在线上开展(APP内悄悄做)

匹配法

注意!很多场景没法上ABtest,比如线下门店,不可能同一个商品,一个客户来了收30,另一个收20,会被投诉到工商局的!

此时可以用匹配法,常见的比如:

  • DID:找发展趋势相同的匹配,对比政策影响效果
  • PSM:先算评分模型,找评分接近的匹配,对比效果
  • RDD:以某个特殊时间点(比如18岁成人礼),做前后时间对比

在以前,PSM+DID的编程会很麻烦,因为涉及多步计算:

1)设定影响因素X,效果Y

2)使用X发生之前的数据(协变量)以X为目标做逻辑回归,求得相似性得分

3)利用KNN,为实际受影响群体,找一个配对对比个体(PSM就是相似性得分匹配一个虚拟的参照组)

4)再用直接计算/OLS,计算X发生前后Y的效应(DID就是前后差分对比)

但是!现在是2026年,用AI辅助,只要一段提示词,就能直接输出结果,体验感拉满(如下图所示)

注意,匹配法本质上还是“找相同类型的对比”,现实中,有可能有某个影响很重要,但是难以量化的因素,无法参与匹配,导致对比失效(比如品牌喜好,消费观念等)所以也不是十全十美

本文由人人都是产品经理作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!