实例|产品新人如何进行数据分析

18 评论 13711 浏览 251 收藏 9 分钟

如果你一入职,就有产品大神带你,那么恭喜你,你很幸福。因为有个产品大神带领着你一路过关斩将,所向披靡。但是如果你是刚入职的小公司产品,那么你很可能只是CEO下面的一个画图经理,有想法,却无法说服老板。经常听被人说拿出数据来,可是找了一堆数据却不知道如何用。只能陷入尴尬的“佛系”画图经理了。

按照惯例,事先声明,本文依然是教产品新人如何进行数据分析。如果你是数据分析大牛,那么希望你能出一篇更好的教程。我会为你打Call哦。

由于没有拿得出手的数据,用其他数据让人觉得夸夸其谈,无法落地。

为了更好地帮助你理解和运用,直接用我上一篇写的文章做基础数据分析,即分析我的文章在哪个平台输出价值最高,以帮助我在以后输出文章时选择首发平台。

一、确定分析方法和获取基础数据和

获取数据的方法有很多,各种网站都有,这个应该不需要我来给大家指路。

本文为了落地分析,直接使用我上一篇文章《思路|产品新人应如何撰写测试用例(功能性测试)》在几个主要平台的文章数据,分析各个平台的输出价值。

想要知道各个平台的输出价值,首先得知道文章输出价值与那些数据相关。由于这是我自己定义的一个名词,所以我从阅读者和作者两个方面阐述下文章输出价值是什么东西。

  • 对于阅读者来说获取知识即体现了这篇文章的价值,具体体现在阅读,订阅、点赞、收藏、评论等数据;
  • 对于作者来说有更多的人阅读,让作者写的东西没有白费,获得一定价值。具体体现在阅读、粉丝、点赞、收藏等数据;
  • 对于作者来说,获得额外的收益,这是最实在的价值,具体体现在赞赏,粉丝等数据。

基于以上三点。我们需要阅读、订阅、收藏等等这些文章的基本数据来进行下一步分析。

*注:或者更多,由于这是一篇给初学者的文章,所以就没有具体展开。

以下是收集各个平台的基本数据。

我的文章在各大平台的阅读量、收藏量等等数据有点惨,你们就将就将就吧,反正我是没脸看。

二、分析数据

既然已经获取到了数据,那么就要开始对数据进行分析了。不过一般如果从正常业务中获取的数据,都需要先进行数据清洗,才能分析。不过这里我们就省略了,毕竟都是用excel分析的,就不玩那么高大上了。

1、数据标准化处理

所谓标准化即将大额数据归结到一个很小的数据中,这个过程也被称为“归一化”。通俗地说,就是把所有数据都归结到[0,1]之间。

数据标准化通常有两种方式。分别为min-maxz-score。这里我主要用min-max标准化。

min-max公式为:

x* = (x-min)/(max-min) 

我这里将标准化后的数据都×10,生成以下数据:

注:数据×10主要是为了好看。你要是喜欢也可以不×10。

以上是我们通过基本数据进行分析的第一步,将数据标准化处理。

2、根据维度进行加权评分

所谓加权评分,就是将第一步得出的数据进行加权处理,即:

加权评分值 = 标准化数据 × 权重

在进行加权评分前,我们先得进行权重处理,权重处理可以使用矩形分析法获得。

如下图:

了解每个维度的含义,然后通过以下步骤进行权重分析:

  • 设置基本原则。 我个人认为重要性应按打赏 > 订阅 > 评论 > 收藏 > 点赞 >阅读进行排序,由于阅读者愿意打赏,那么文章肯定帮助到了他,以此类推分析;
  • 根据设置的原则,进行处理。即行列对比,如果行比列重要的设为1,行没有列重要的设为0。
  • 对每一行数据进行合计;
  • 对合计进行权重计算,即:维度权重=维度合计/总维度合计,由于某些维度合计为零,因此需要对所有维度合计进行**+1**处理。

根据以上步骤得出数据,阅读量权重=1/(1+4+2+5+6+5)*100%=4.35%,其他数据以此类推。得出上图中的各个维度权重的数据。

将权重与评分结合,即得出上图的维度权重评分数据

四、对平台进行加权评分

同理,我们需要先确定各个平台的权重比,因为我们要分析这篇文章在哪个平台发布的价值更高,那么应该从平台的影响用户数去比较。那么,我们可以根据PV/UV去判断平台的用户数来设置权重。

上图为各个平台的权重,这里需要说明一下,由于人人都是产品经理和人人都是产品经理讨论的平台,在此不做优劣评比,因此权重占比设为一样。

根据平台权重,那么可以轻易得出我的文章在各个平台的文章输出价值。

三、数据总结

通过上面的方法,可以轻易得出想要的分析结果。根据这份结果,我如果还想发文章,肯定会考虑这个来选择首发平台。而不是通过拍脑门决定首发。

以上为入门数据分析方法,如果你学会了,那么就用起来,开始怼你的BOSS! 嗯,就是这样。

相关阅读

思路|产品新人应如何撰写测试用例(功能性测试)

 

作者:光点神奇,微信公众号:产品研究所

本文由 @光点神奇   原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 unsplash,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 感觉很有帮助~可是最后那个文章输出价值评分表没看明白怎么来的 😥

    来自北京 回复
  2. 有一个不理解的问题。
    请问,各平台的PV和UV数据是从何得来的呢?

    来自北京 回复
  3. 想问问作者大大,上面的知识在产品经理工作的哪些方面可以运用?

    回复
    1. 额,可以用的地方有点多呀,比如:判断这个功能要不要做,或则这个功能要不要继续深度优化等等

      来自江西 回复
  4. 最后那个表怎么得出来的没太看明白,阅读量、收藏量那些数据怎么没了 😈

    来自广东 回复
  5. 有大佬讲讲有哪些地方可以获取数据吗

    回复
  6. 懂了懂了…突然发现有个细节没读得很通顺

    来自重庆 回复
  7. 阅读量权重=1/(1+4+2+5+6+5)*100%=4.35%,其他数据以此类推。得出上图中的各个维度权重的数据。
    一直没有理解后面的 142565这几个数字是怎么来的… 😥

    来自重庆 回复
  8. 权重处理的矩形分析法中有个错误吧,“收藏”没有“订阅”重要吧,应该为0,不是1

    来自江苏 回复
  9. x* = (x-min)/(max-min) ,这条公式各代表什么,小白不解,求赐教。

    来自广东 回复
    1. x*表示x对应的标准化的值,在常用函数中通常用y来表示。
      x表示自变量
      min表示最小值
      max表示最大值
      示例:要求阅读量在各大平台的标准化的值
      对于人人都市产品经理来说,x为25000,max为25000,min为276。套用公式,x*为1。由于我*10,所以结果是10

      来自广东 回复
    2. 还有一个问题,x是自变量的话,x为什么要取25000,不取别的呢。 😡

      来自广东 回复
  10. min-max 经这个公式算出来的数据,没有看明白,这里的 min、max 分贝指的是什么数据?

    来自上海 回复
    1. 就是那个纬度下最大值和最小值,比如阅读量,最大值是25000,最小值是知乎的276

      回复
  11. 标题的序号错了一个

    读了有启发

    来自北京 回复
    1. 谢谢提醒,我是用markdown 写作的,然后人人都是产品经理好像不支持,每次都会出错,需要改很多小地方😂😂😂

      回复
  12. 虽然好像没太明白,不过好像很厉害的样子。

    回复
  13. 学习了~!

    来自广东 回复