数据分析学习笔记:明确问题与假设检验法

0 评论 5753 浏览 46 收藏 8 分钟

大家有没有发现,随着数据的积累,对数据的分析显得越来越重要,数据分析能力也成为了产品经理必备的技能之一。下面分享个人的学习笔记,文末也附上了一些互联网数据分析相关的名词解释。

数据分析前提:确定问题,明确目标

未明确想要解决的问题,想要达成的目标,就进行数据分析,就如下图中未定下目的地就上路旅行一样,兜来兜去不知前往何处。

那我们该如何明确问题呢?

步骤:

  1. 明确提出问题方的关注点;
  2. 明确解决问题的目标;
  3. 可用资源有哪些?
  4. 问题拆分。

例子:老板给了你一堆数据,说:看看,然后想个方案,提高下日活。

接到任务后,我们需要:

当前产品所处的背景是?是想提高单一个产品的日活,还是其中的某些功能活跃度?

我们跟老板心中的日活定义是否一致(是对产品进行了任意操作就算活跃用户,还是需要在产品上使用多少分钟才算)?

任务是提高多少日活?可调用的数据是否足够,若不够,还需要哪些支持?

问题拆分:

  • 导致用户沉默的原因?
  • 我们的活跃用户有哪些特征?
  • 签到功能促活效果如何,存在什么问题?
  • 推送消息后效果如何,存在什么问题?

……

通过以上,我们可以将一个大问题,拆分成一个个明确的、可直接分析的小问题,然后去综合分析,解决大问题。

数据分析方法:假设检验法

世事纷纭、真假难辨。书籍《深入浅出数据分析》中,介绍了一种方法:假设检验法。将收集的数据,进行整合评估,对某些事件进行预测分析。

我们先来看一个例子:

智能手机这几年,迎来了行业爆发的阶段,经常会有新型的手机发布,如果让你来预测某公司的新型手机发布会时间,你会怎么做呢?

我们使用假设检验法来试着解答这个问题:

假设有以下几种可能:

  1. 一周内召开发布会;
  2. 下个月召开发布会;
  3. 半年内召开发布会;
  4. 一年内召开发布会;
  5. 取消发布新产品。

我们搜集到以下资料:

  1. 公关负责人在回应:公司在一个月内不会开发布会;
  2. 新闻已显示供应商有手机壳产品流出;
  3. 按照惯例,该公司每半年会发布一款新产品,距离上次发布已经过去3个月;
  4. 今年以来,大部分知名手机厂商发布新手机的频率都提高了;
  5. 据传:该公司ceo表示一年内不会发布新产品。

然后我们使用证伪法

从第一条资料,我们可证明假设1(一周内召开发布会)不成立。

但是其他资料并无法帮助我们排除选项。

接着我们通过将证据与假设进行推断,看看该证据是否支持假设成立。支持为“+”,不利为“-”,无法提供支持或不利因素为0

此时,我们得出:下个月或者半年内召开发布会的可能性最高。根据目前的证据,我们还无法得出更精准的数据,所以应该收集更多信息。

本例可能略有不当,但通过以上,我们可以知道如何进行假设检验法,对事件进行推测:明确问题-提出假设-收集证据-进行证伪-进行推断-得出结果。

希望帮助大家能够了解这种方法,很简单,也很实用。

附:常见名词解释

PV(Page View)页面浏览量:表示页面被打开的次数,用于评价网站流量的指标之一。

UV(Unique Visitor)独立访客:通过互联网访问、浏览某个网页的人数。通过ip地址来识别,一个ip地址为一个访客。计算时间内(00:00-24:00)同一个访客多次访问,只算一次。

DAU(Daily Active User)日活跃用户数量:一般指一日之内启动或者对产品进行了任意操作的用户数(去除重复登陆的用户),用于反映产品的用户规模。

MAU(Monthly Active Users)月活跃用户数量:一日之内启动或者对产品进行了任意操作的用户数(去除重复用户数),用于反映产品的用户规模。

CAC(Customer Acquisition Cost)用户获取成本:总营销费用除以其打来的新增用户数。表示获取一个新用户所花费的成本

ARPU(Average Revenue Per User)每个用户平均收入:计算时间内,从每个用户处所得到的收入。

近7日:包括今日,如今天是3月8号,此时统计近7日的数据则为:3月2号-3月8号

过去7日:不包括今日,如今天是3月8号,此时统计近7日的数据则为:3月1号-3月7号

着陆页(LandingPage):用户进入目标网站的第一个页面。用户访问的一般过程:站内着陆页A → 后续受访页面B→ 后续受访页面……→ 站内出口页X

会话(Session):用户从打开到关闭应用/网站,被视为一次会话。

跳出:用户进入着陆页就离开。用户来到网站后,除了浏览LandingPage之外,没有发生其他任何操作就离开了网站,被视为跳出。

跳出率 = 访问了一个页面的Session数/总的Session数,用来衡量着陆页的质量。

退出:当用户从某个页面离开了网站,即视为退出。

退出率:某页面退出率 = 从某页面离开网站的次数/该页面浏览总次数。当用户从某个页面离开了网站,即视为退出。退出率只能用来分析特定流程中的某些页面能不能满足用户的需求的问题。

希望对大家有所帮助。

 

作者:彬,微信公众号:有个思享,专注读书与产品心得分享,欢迎交流。

本文由 @彬 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!