数据分析模型：归因分析

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

请叫我宋宋

2019-05-27

9 评论 48551 浏览 263 收藏

12 分钟

本篇讲述归因分析在实际业务中的应用及实现方法，主要讲解「渠道归因」和「运营位归因」的「单值传递归因」、「多值记录集合归因」、「时序还原归因」以及「路径还原归因」几个方法。

01 了解归因分析

随着互联网技术和业务的发展，广告投放相关的业务也随之兴起。那么广告投放的效果评估也就随之而来。

首先，广告的投放一般都是收费模式，所以选中的渠道商的好坏直接和自己的利益挂钩。于是，「归因分析」便最早应用在了广告投放行业。（归因分析能最先应用在广告行业还有一个原因，就是广告的目标是单一的。比如：无论多少个渠道商，最后推的都是同一款 App；但是若将在产品内部的运营位进行归因，就需要考虑这个广告位和商品是否有关系。）

举个例子：一款 App，投放了三个推广渠道，最后 App 通过某个渠道商完成了下载。此时，我们需要对这三个渠道商对本次下载的贡献能力进行一个评估。这时，就用到了归因分析。

02 渠道归因（站外归因）

渠道归因是目前市面上比较广泛的归因应用场景。

图中举例说明了一个渠道归因的大致流程和思路：用户分别浏览了「Youtube」「Google」和「Facebook」后下载了 App，通过归因分析来计算三个广告的贡献。

点击放大图片查看

03 运营位归因（站内归因）

随着渠道归因的普及，从业人员逐渐认可了归因的计算方法和功劳的分配方案，虽然模型的不同会导致计算结果存在一定偏差，但是这些都在可接受的范围内。

后来，随着产品的复杂化、公司部门的事业部、业务线的划分。产品内部的运营位逐渐被广告化，于是运营位的归因需求逐渐被暴露出来。

接下来，我们来说一下运营位归因的演进历史。

1. 传递式单值归因

传递式单值归因是归因分析由渠道转向运营位时，采用的简单转化方案。当然这个方案，至今还在被一些公司沿用。该方案的优势：逻辑清晰、实现简单；劣势是：无法匹配稍微复杂的运营场景。

图中举例说明了一个传递式单值归因的大致流程和思路，由于技术的原因，在记录广告时，使用的是替换的策略——即每次只记录前一个广告，当出现新的广告则替换前一个广告名称，直到成单转化，记录在订单上。

用户分别浏览了「广告 A」「广告 B」和「广告 C」后购买了「商品 C」，通过记录最近一次广告运营位，来进行归因，计算运营位的贡献。

点击放大图片查看

在互联网初期，人们的业务模式都比较简单、使用流程也很单一，使用前篇讲解的「单值传递归因」完全够用。

但是某一天，人们发现自己 App ，已经不再是简简单单的「广告 → 商品 →购买」路径，又多出来了很多其他的路径。比如：「搜索 → 商品 → 购买」、「推荐 → 商品 → 购买」或者「推送 → 商品 → 购买」，甚至是「红包 → 商品 → 购买」时，我们会发现，原来的那套逻辑，有一些过时了。

解决问题的办法也很简单，就是将原来的一个值，变为记录多个值。那么，我们就来推演一下后续每个版本的归因分析的实现的思路和计算方法。

2. 场景

我们假设一个场景，接下来三个模型的演绎都使用该场景进行还原。

首先，用户来到了一款电商类 App，打开首页，看到的是顶栏「搜索」「头部广告」腰部的「推荐商品」，其中「头部广告」是一个主广告，点击进去分为两个「分会场 A」和「分会场 B」的子广告，「推荐商品」动态计算，展示您最可能购买的商品。

接下来，一个用户开始使用我们的 App，行为如下：

进入首页，先行搜索，在列表页看到了商品 A，浏览了商品 A 的详情，觉得不错，但是并未购买；
从详情页返回到首页，看到头部广告，点击进入到主会场页面；
在主会场页面，看到分会场 A 和分会场 B，点击进入分会场 A，再次看到商品 A，点击再次查看商品 A 详情；
页面返回到主会场页面，进入分会场 B，在分会场 B 中浏览了商品 B 的商品详情；
直接退出到了首页，发现推荐位在推荐商品 A，进入再次查看商品 A 的详细信息；
看到了推荐的评语，下定决心，购买了商品 A。

最终，我们想看每个运营位，对用户购买商品 A 这个决策带来的贡献。

3. 多值记录集合归因

由于业务变得复杂、来源增多，那么最简单的方式，就是由原来单值的记录形式变为多值。

再解决额外引入的几个问题，分别是：

为了避免无穷无尽的记录广告，以及将不属于这个商品的广告记录在这次购买中，需要引入一个重置的机制，比较简单的重置就是：App 冷启动、访问回首页和发生后支付就进行重置。
记录下了广告的集合并完成了数据的采集，后期需要再进行逻辑的运算，来给每个广告位分配功劳。

4. 时序还原归因

在我们看了多值集合归因的推演之后，可以很明显的发现其中的问题：重置机制实在是太坑了，回到一次首页之后，全部的努力就白费了。

那么，有没有更好的办法来解决这个问题呢？

实际上，我们从根本上来思考这个事情，我们想探索的是「广告」和「成单」之间的关系，那么这层关系是依靠什么进行关联的呢？很简单，是依赖这个商品关联。

那么，我们再将这个逻辑抽象一层的话，这整个行为中最为紧密的关键节点是什么？

——我认为是：点了广告，所以让你看到了这个商品，因为看到了这个商品，所以你才产生冲动购买了这个商品；那么转化为抽象的描述就是：广告 → 曝光 → 转化

那么，新的问题来了，我如何去探索这个关系呢？

别忘了，人的行为发生是有先后顺序的，于是我们尝试通过时间序列来还原用户当时的场景，再根据曝光→转化，来跳过一些和转化无关的广告位。（演绎图需从购买商品为起点看起）

5. 路径还原归因

从上面的时序还原的归因模型中，可以看到：已经可以比较好的解决问题了。但是，距离完美，还是差那么一步。就是类似于「主从广告」这种广告结构时，不能很好的进行还原，两个有关联的广告相邻时，也不能很好的进行关系的计算。

解决办法也是有的，我们需要再引入一个维度：时间的维度可以表明事情的发生顺序，再引入路径的维度，就可以更加准确的还原事情的流向。

像「头部部广告 → 广告 A → 广告 B → 广告 A」的这种情景，通过路径可以还原出一个树形结构，即「头部广告是广告 A 和广告 B 的父节点」，自然几个广告的关系也就出来了。（演绎图需从购买商品为起点看起）

04 总结

本文章帮大家梳理了一下归因分析的一些思想，类似于归因分析这种和业务贴合特别紧密的分析模型，是会随着业务形态的变化而逐渐优化和改变的。

目前大部分的归因分析都在应用「单值」或「集合」的形式进行记录，极少数使用「时序还原」的形式，因为这个计算量太大了，而且需要引入一些标准化的埋点才可以做。当然，「路径还原」就更少了，因为他是在「时序还原」的基础上又提升了一档难度，需要再额外记录页面的前项地址，来进行路径的还原。

最后，希望大家可以在了解了归因分析的前世今生和未来后，可以了解的是结合自身业务情况进行数据的推导和演绎的能力，而不是将一个模型一成不变的进行套用。

作者：宋宋，神策数据产品经理。

本文由@请叫我宋宋原创发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash, 基于CC0协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

请叫我宋宋

3篇作品 140708总阅读量

当内容社区向用户伸手“要钱”

04-273851 浏览

优化需求到底算不算新需求？

09-099636 浏览

刷屏小红书的「上海玫瑰」，给门店体验营销带来这三点启示

02-176102 浏览

小红书，正在攻克“男”关

11-303212 浏览

做私域，必知的4个「用户调研」方法

04-196111 浏览

Echailin

层层推演分析，赞

最近来自北京回复
螺蛳粉警察

无语子，人家就举了单一用户场景讲归因分析的思想，看懂了又说简单？

最近来自上海回复
技术的世界

简单的事，说复杂，真是有够蛋疼。

最近来自福建回复
梓庭居士

感觉宋宋说的有点复杂了，我理解：就是需要看成交商品在投放资源位的全引导和直接引导数据。

最近来自北京回复
达

其实写得挺好的。点个赞！

最近来自中国回复
cathy

你的手机没电没网了，我们的生活方式是什么时候回来

最近回复
Frank

简单的事情讲复杂了。

最近来自北京回复
1. Chelsea 回复Frank
  
  简单讲这个平台说讲的太简单了，不让提交。。。。。这个平台充斥着这种硬生生复杂化的白话文。。。。
  
  最近来自上海回复
小光头

对现阶段的互联网，这种本身可以简化的东西，讲的有点复杂了

最近来自广东回复