想成为数据产品经理，先掌握这些数据分析方法论（二）

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

想成为数据产品经理，先掌握这些数据分析方法论（二）

Mr.墨叽

2019-10-16

3 评论 15315 浏览 102 收藏

18 分钟

之前在《想成为数据产品经理，先掌握这些数据分析方法论》一文中，分享了一些基础的数据分析方法，从业务分析、用户分析和产品运营三个方面提供了一些分析的切入角度。接下来，进阶一步，我们再来看看还有哪些实用的分析工具。

一、业务分析：如何做诊断归因？

在《想成为数据产品经理，先掌握这些数据分析方法论》一文中分享过杜邦分析法，杜邦分析法是财务中常用的拆解指标的方法，可以将核心指标拆解为多个因素乘积的形式，如GMV=访客数*转化率*客单价。

在做完指标拆解后，应该如何进行进一步归因呢？本月GMV上涨了，是访客数增长的贡献还是转化率上升的结果，抑或是因为客单价的提升？

为此，我们需要引入另一个在财务领域广泛应用的分析方法——因素分析法。

1. 因素分析法是什么？

因素分析法是在将核心指标拆解为多个因素后，识别各因素对核心指标影响程度的一种方法。

我们将指标拆解后，当然，可以用控制变量法来计算每个因素的贡献，比如，假设上月的GMV、访客数、转化率、客单价分别为GMV₀_、V₀、T₀、M₀，本月的GMV、访客数、转化率、客单价分别为GMV₁_、V₁、T₁、M₁，那么

GMV₀=V₀*T₀*M₀

GMV₁=V₁*T₁*M₁

我们要判断访客数，也即流量的贡献，按照控制变量法，假设转化率和客单价与上月一样，访客数变化所带来的GMV提升为：

Attr_V=V₁*T₀*M₀– V₀*T₀*M₀

同样，计算转化率贡献的公式为：

Attr_T=V₀*T₁*M₀– V₀*T₀*M₀

这里用到的是传统的控制变量的思想，但要使用控制变量法需注意一个前提，那就是各个变量之间要相对独立，但真实情况下，各个因素之间都是相互影响的，很难保证独立性。

而因素分析法所采用的是连续替代的方法，在计算下一个因素的贡献时，会考虑到上一个因素的变化，可以有效地规避控制变量法中不独立的问题，我们具体看一下如何操作。

首先，我们在上月GMV₀的基础上，用本月的访客数V₁替换V₀，接着再依次用T₁替换T₀，M₁替代M₀，可以得到：

上月GMV：GMV₀=V₀*T₀*M₀ ①

第一次替代V：V₁*T₀*M₀ ②

第二次替代T：V₁*T₁*M₀ ③

第三次替代M：V₁*T₁*M₁ ④

而每一次替代前后的变化，就是对应因素的贡献值，即：

Attr_V=②-①

Attr_T=③-②

Attr_M=④-③

GMV₁-GMV₀= Attr_V+ Attr_T+ Attr_M

2. 举个栗子

下面，我们举个实际的例子来熟悉一下上述方法。

假设9月和10月的数据如下：

那么，用因素分析法依次替代后的结果如下：

9月GMV：GMV₀=V₀*T₀*M₀=12w ①

第一次替代V：V₁*T₀*M₀=15*1%*60=9w ②

第二次替代T：V₁*T₁*M₀=15*2%*60=18w ③

第三次替代M：V₁*T₁*M₁=15*2%*70=21w ④

各因素的贡献率分别为：

Attr_V=②-①=9-12=-3w

Attr_T=③-②=18-9=9w

Attr_M=④-③=21-18=3w

由此可见，10月的访客数较上月有所减少，导致了3w元GMV的流失，但流量显然更精准，转化率明显提升，且转化率的贡献最大，带来了9w元的GMV增量，此外，流量质量也较高，客单价有所上涨，带来了3w元的GMV提升。

因此，后续应该加强流量的引入，转化率可以分渠道进一步分析，针对高转化率的渠道进行重点运营，而客单价可以进一步分析是产品价格提升了，还是用户买的产品数量更多了。

因素分析法的作用，就在于可以找到关键的正向或负向因素，当精力或资源有限时，可以有的放矢，重点解决关键问题。

3. 替代顺序如何确定？

看到这里，不知道大家有没有发现，如果改变一下替代的顺序，各因素的贡献值会发生变化，比如，如果先替换客单价，那客单价的贡献值肯定跟上面的结果有所差异。

那么，我们应该如何保证因素分析法的有效性呢？

因素分析法是建立在某种前置假设的逻辑之下的，既然无法将各因素割裂进行分析，那么就依次考虑各因素的叠加效应，而这个次序需要遵循实际经济意义上的先后逻辑。

比如，以上述的访客数、转化率和客单价为例，自然是先有访客到访浏览，才会有下单转化，之后才会产生交易金额。也即先得有人来，来了才会决定买不买，决定买了再看花多少钱买。

同样，如果我们把GMV拆成价格*销量，那么应该先考虑价格的贡献，再计算销量的贡献，因为是先定价，才会有销量，而且销量很大程度会受到价格的影响。

二、用户分析：如何分析品牌认知差异？

网络社交媒体和电商平台中沉淀着大量的用户反馈信息，通过舆情的挖掘分析，可以为品牌商提供多角度的参考建议，指导品牌商进行产品或服务的优化。

很多品牌商都会定期找调研公司进行调研，从而了解用户对品牌的认知，以指导下一阶段的品牌形象建设或品牌差异化策略。

有很多调研的分析方法同样适用于舆情的分析，接下来就分享其中的一种——对应分析。

对应分析(Correspondence analysis)也称关联分析，是一种多元相依变量统计分析技术，是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。

简单来讲，其实就是先将各类变量放到一起进行相关性分析，把关联度高的进行归类，达到降维的效果，如将为二维（两个分类），接着，再看各变量在这个二维空间中的位置，最终判断变量间的关联性。

对应分析与因子分析的差异，就在于因子分析是针对一个变量中的值进行归类，看的是相同变量的相似性，如老鹰和麻雀都可归为鸟类，而对应分析包括多个变量，还能看不同变量的关联性，如老鹰（鸟类）与食物（鼠）的关联度高，麻雀（鸟类）与谷类（食物）关联度更高。

对应分析的具体原理在此不做赘述，大家感兴趣的话可以上网查阅，接下来，我们看一看实际的例子（数据都是我编的，如有雷同，应该是抄我的）。

1. 基础入门：简单对应分析

现在，假如我们将用户的评论、反馈数据，通过切词、归类编码后，得到以下数据表：

简单对应分析适用于两个变量交叉分析，我们先选“品牌”和“认知”这两个变量来进行对应分析。

在很多分析工具中都有对应分析的功能或程序包，我们以SPSS为例，在SPSS菜单中选择【分析】-【降维】-【对应分析】，选择行列分别为“品牌”和“认知”，可以得到以下摘要表：

我们看到显著性sig=0.000<0.01，卡方检验通过。

然后，观察第一列“维”（也就是所谓的归类）和后面的累积惯量比例，可以看到维1和维2加起来的累积惯量比例已经达到99.5%，也即用这两个维度已经可以解释“品牌”和“认知”这两个变量中99.5%的信息。

接着，我们可以得到具体类别在这两个维度上的得分，生成对应分析图如下：

通过对应分析图分析关联性目前有多种方法，如向量分析、理想点与反理想点等。

这里我们用最简单的观察法进行定位分析，首先标出几个品牌的位置，然后观察品牌认知的形象词与品牌的距离，距离越近，说明关联程度越高。

至此，我们可以大致判断出各品牌在消费者心目中的形象。

2. 进阶拓展：多元对应分析

简单对应分析比较直观，但其缺点在于只能分析两个变量。如果我们除了分析品牌形象以外，还想看看各类型用户对于品牌认知的差异，那么就需要用到多元对应分析。

在SPSS菜单中选择【分析】-【降维】-【最优尺度】，选择分析变量为性别、年龄、品牌、认知，最终生成结果如下：

从图中可以看到，50岁以上女性更偏好悠悠诗，她们觉得悠悠诗是“高端的”。40-50岁人群更偏好星七克和雀窝。

多元对应分析的信息量相对较大，可以得到更丰富的解读，但理解较为困难，可酌情选用适宜的方式进行分析。

三、产品运营：如何评估产品功能价值？

之前的文章中讲到了评估产品使用广度、深度和粘性的指标，用来监控产品当前的使用状况。

但该方法只能适用于产品上线之后的效果评估，而在实际工作中，产品经理们还经常遇到另一类更为频繁且棘手的问题，那就是——没有资源，排不上期！

需求总是呈井喷之势，而资源始终是挤牙膏状态，产品经理平日做的最多的事就是进行需求评估，通过形(pai)而(nao)上(dai)的方法，将需求拍出，额，不对，排出优先级。

那么问题来了，我们应该怎样进行优先级的评估呢？

同样，我们可以向传统调研取取经，接下来，就跟大家分享一个方法——Kano模型。

1. 理论基础——双因素理论

在讲Kano模型之前，我们先熟悉一下这个模型的理论依据。

了解过组织行为学的同学对双因素理论肯定不会陌生，双因素即“保健因素”与“激励因素”，美国行为科学家赫茨伯格认为，满意的对立面并非不满意，而是没有很满意，而不满意的对立面也不是满意，而是没有不满意。

一段绕口令后，我们举个实际的例子，公司福利、公司政策、工作环境，这些因素容易引起员工的不满，但如果满足了这些基本条件，员工就会满意了吗？

这些在员工看来只是基本的“保健因素”，就像每天都能吃饱并不能使我们幸福一样，而个人成就、社会认同、个人成长，才是能给员工带来满足感的“激励因素”。

赫茨伯格认为“保健因素”来自于外部环境，而“激励因素”是一种内在激励，马斯洛底层的生理、安全和感情需要都可以认为是“保健因素”，而自我实现等高层需求属于“激励因素”。

说白了，放到产品的语境下，就是有的功能是必需的，但不能让用户爽，而有的功能真的可以让用户感到爽，激发用户的“Aha Moment”。

2. 研究方法——Kano模型

Kano模型的底层逻辑和双因素理论一样，在做问卷调研时，一般会问正向和负向向两个问题，即：

正向：有这个功能，你的态度
负向：去掉这个功能，你的态度

依照此方法，对于每一个功能，我们都可以收集并汇总统计用户的态度数据。

基于上面的数据统计，可以进一步计算出Better-Worse系数，表示该功能可以增加满意/消除不满意的程度。

增加后的满意系数：（A+O）/(A+O+M+I)

消除后的不满意系数： -1*（O+M）/(A+O+M+I)

我们将所有功能的Better-Worse系数放到一张图上，就可以对功能进行归类分析了。以手机为例，构建假数据制图如下：

魅力因素：非必要需求，但可以给用户意外惊喜。
期望因素：用户很期望被满足的需求，没被满足的话会很失望。
必备因素：必要的基础需求，有的话很正常，但绝不能没有。
无差异因素：用户不太在乎，有没有都无所谓。

通过象限图我们可以看到，双屏可折叠等黑科技非常吸人眼球，虽然不是必需的，但却可以大大提升满意度。

AI摄影、超长待机等功能属于期望因素，跟用户的满意度有很大关系，所以很多手机品牌商不断在摄影功能、待机时长上做文章。

高性能处理器、大尺寸、指纹识别已经逐渐成为必备因素，这与行业的教育引导有关，当大家都习惯了用手机打游戏、看视频，高性能、大尺寸自然会成为必要条件。

还有一些功能虽也有所创新，但比较鸡肋，用户不太关注，如type-c接口、无线快充。

Kano模型比较适用于产品的需求调研，无论是前端产品还是后端产品，先可基于定性访谈收集需求，再收敛需求进行定量调研。

针对期望因素和必备因素，需要重点维护及迭代优化，而魅力因素属于亮点功能，有时间精力可以逐步加大投入。对于无差异因素，应当减少维护和运营的成本，甚至将功能下架。

每个功能所处的位置并不是静态的，甚至往往会随着时间推移发生很大的变化，就跟产品都有生命周期一样，功能也会有自己的生命周期，定期运用Kano模型进行产品功能分析，可以帮助我们掌握需求变化，从而指导下一阶段的产品升级。

#专栏作家#

Mr.墨叽，公众号：墨叽说数据产品，人人都是产品经理专栏作家。电商行业资深产品经理，擅长策略构建，数据分析。

本文原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

数据分析方法论文章被收录于该专栏

共 13 篇文章15217 人已学习

Mr.墨叽

数据/算法策略产品经理

13篇作品 303599总阅读量

一种追求产品极致的思维框架：产品应当追求有条件的极致

02-065425 浏览

09-2896357 浏览

03-314853 浏览

03-012691 浏览

08-086465 浏览

起点课堂

大家期待已久的《数据产品经理实战训练营》终于在起点学院（人人都是产品经理旗下教育机构）上线啦！

本课程非常适合新手数据产品经理，或者想要转岗的产品经理、数据分析师、研发、产品运营等人群。

课程会从基础概念，到核心技能，再通过典型数据分析平台的实战，帮助大家构建完整的知识体系，掌握数据产品经理的基本功。

学完后你会掌握怎么建指标体系、指标字典，如何设计数据埋点、保证数据质量，规划大数据分析平台等实际工作技能～

现在就添加空空老师（微信id：anne012520），咨询课程详情并领取福利优惠吧！

最近来自广东回复
~續™鍀澀®

GMV=访客数*转化率*客单价

转化率=下单数/访客数
客单价=销售额/顾客数

GMV=下单数*销售额/访客数

为啥不比对这几个呢？ 🙄

最近来自上海回复
1. Mr.墨叽作者回复~續™鍀澀®
  
  怎么拆都可以，只要有经济意义。
  按你的拆法，也应该是 GMV=顾客数*销售额/顾客数=销售额，绕了一圈儿回去了，
  因为我这里的转化率是用户转化率，转化率=下单的顾客数/访客数。
  
  最近来自浙江回复