【干货】从网易产品经理笔试,教你如何做数据估算题

起点学院产品经理365成长计划,2天线下闭门集训+1年在线学习,全面掌握BAT产品经理体系。了解详情

shujugusuanti

2016年网易产品实习中,有这么一道数据估算题:

估算今年全国通过网络参加考研培训的人数?

这类题型主要考察:

  1. 逻辑思维能力:遇到问题能否清晰有条理。
  2. 数据能力:对数据的关注度,是否重视日常的数据。
  3. 细节把握能力:是否注意分析中的细节,结合实际情况去细化

001

要点:

  • 准确的数据越多,估算越有根据,也体现了应聘者对数据的重视。
  • 漏斗模型,注意每个环节的人员流失率。环节考虑的越多,对问题的分析也更加透彻。
  • 用户分类和画像。尽量结合用户的使用场景,对用户进行分类,这样数据也更贴合实际情况。
  • 思路比结果重要。最终的数据可能不在一个级别,但是在有多种方案的情况下,通过不同方案的比较大致可以估算出一个量级。考察的重点是思维。

本题解答思路(供参考):

步骤1:做加法

(本阶段不求正确,多多益善)

寻找准确能够获得的数据,从不同维度来寻找数据,类似头脑风暴:

1. 提取关键字法:

可以通过去掉其中的一些形容词,提取关键字来联想

全国+考研:今年全国考研人数

网络+培训:今年全国网络培训机构数,机构收入数,培训人数

2. 从人、地点、时间、钱几个维度来寻找线索。

  • 人:考研的人数,培训老师的人数
  • 地点:高校数,机构数
  • 钱:在线教育交易额,客单价。

3. 从提供端和需求端两个维度

提供端考虑:机构数,机构老师数。需求端:课程数,学生数。

002

步骤2:做减法

从步骤1提取自己较为熟悉的数据且和目标数据相关度更明显的数据。目标事件为考研培训,直接参与的主体是教师和学生,我们不妨通过教师数目和学生数目来突破。

步骤3:方案分析

本例提取考研学生报名数:170万,大学教师数150万

3.1 由培训教师来计算

考研科目的培训主要集中在外语,数学,政治等科目。

英语教师、数学教师、政治教师累计占比:

一本院校:

计130所,平均每个学校英语(含小语种)教师60名,数学教师(基础数学)按50人计,政治教师按40人计。每个老师平均按30个学生计,可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报1.5门课计。平均每一百个老师有3个做培训。

得到:130x(60+50+40)x30x3%/1.5=1.17w

二本院校:

750所,平均每个学院英语老师(含小语种)教师35人,政治教师30名,数学教师计30人,每个老师平均按20个学生计(教师影响力认为比一类院校差),可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报2门课计(认为二本院校学生培训需求相对较强)。平均每一百个老师有5个做培训(认为二本院校教师时间相对充裕)。

得到:750x(35+30+20)x20x5%/2=3.18w

方案2合计:1.17w+3.18w=4.35w

3.2 由考研学生来计算

按大学来分:一本院校研学生占总考研人数比50%,由于资源相对较多,集中在线下培训,其中参加线上考研培训的比例按1%计,二本院校考研人数占总考研人数比按40%计算,参加线上考研培训占考研人数的比例按3%计算,三本考研人数较少占总考研人数比计10%,参加线上培训的占考研人数比例计2%。

计算结果:170w x(0.5×0.01+0.40×0.03+0.10×0.02)=3.23w

步骤三 计算过程中的要点

要点1:漏斗模型:

每经过一个环节,数据都会打折,留存的百分比直接相乘得到结果。

方案1漏斗模型:

003

在顶端数据确定的情况下,漏斗本身实际存在的环节越多最终的误差越大,分析时选择的环节越多,数据越接近真实数据。最终的结果为漏斗底部数据乘以各个环节的留存百分比。

要点2:通过用户画像对用户进行细分。

根据学生考研院校的不同,分为一类本科和二类本科,根据教师所教的课程不同对教师进行分类。分类原因是因为这些不同的用户在不同的漏斗环节具有不同的流失率,有利于数据更加准确。本例在答题时间充裕以及对考研情况非常了解的情况下,学生可以继续细分为不同专业的学生,不同收入水平的学生,对于政治教师可以继续根据教师的方向分类,例如和考研相关的马克思主义理论教师从事培训的比例相对较高,可以和其他方向分开计算。甚至可以根据年龄进行细分,有经验的较年长的老师可能参加培训的比例更高等。

步骤四:交叉验证

本例中两种计算方案最终数据大致相当,得到了一定的验证。

总结

004

主要的思路和流程如上图:以上简要介绍了产品笔试面试中常遇到的估算题。最终的数据不一定可靠,但是思路是大致一样的。功夫在平时,我们只有多关注数据,平时有意识对用户进行细分,才能更好的锻炼思维。

 

作者:孙辉(微信号huihuishengwei),在校研究生,产品爱好者,创业团队产品经理

本文由 @孙辉 原创发布于人人都是产品经理。未经许可,禁止转载。

您的赞赏,是对我创作的最大鼓励。

评论( 20

登录后参与评论
  1. 思路挺好的,估计实际操作中需要比较准确的用户调研。 :smile:

    回复
  2. 费米推理法。作者思路方向绝对是很棒的,不过那些各科目教师参与培训比率和学生平均报1.5门科目这些数据的获取确实缺少调研,来自于经验吧,需要进一步论证,或者换个方向。

    回复
  3. 我最后做这个题的时候只有十分钟,写了5行左右就没有时间了,也没有写完。我当时是想从宏观层面,如历年的研究生报名人数,录取人数,网络用户占比等。但是这样的数据又没有办法查阅,所以如果自己去估计数据的话估计更加离谱。所以楼主的估算方法还是有不错的价值的

    回复
  4. 查查四年前和五年前的本科录取人数,得出一个增长率,再查查去年的考研人数,乘以增长率,就得出今年的考研人数了

    回复
  5. 不要轻易就冠之以干货~

    回复
  6. 你这个,随便一个数据估算错误,差距就大了。比如,平均每人按报1.5门课,这个数据确定?平均每一百个老师有5个做培训,凭什么?这种数据都是在YY啊,没有任何科学依据。而且,参加培训的人数,和培训教师的人数,也没关系吧!

    回复
    1. 回复

      是的,结果很不精确。培训教师的数目,是来作为量级参考的。

    2. 回复

      问题是几乎每一个参考系数都是YY的,何来自信量级能正确?

  7. 这个思路不敢苟同

    回复
  8. 你这个整的太复杂了,一上来哪有这么多时间,其实这里面只需要关注2014年,2015年的4个数据就行了。分别是2014、2015年的在大学本科毕业生的总人数,参加考研的人数,录取人数,参加网络培训的总人数(发放一份调研问卷,调研一下已经考上研究生的同学,他们有多少人参加的网络培训,得到一个百分比)。通过2104,2015本科毕业生的总人数,参加考研的人数,录取人数,参加网络培训的总人数这四组数据,分别得到四个百分比,得到他们之间的一个关系,然后查阅一下2016年将要毕业的大学本科毕业有多少人,通过2014年,2015年的比较数据就能比较精确的得到2016年大概会有多少同学会参加网络在线培训。说说你分析的问题,大学教师的多少和考研人数的多少没得半毛钱关系,一个班50人也是教,40人也是教。你所说的占比1%,2%的依据是什么,数据可靠吗?你怎么去统计这部分数据,所以你这里面没有考虑数据统计的正确性,既然这样的话,你得到的数据的可靠性就会很差,说白了,一堆很水的数据。所以结论就是好木匠不一定要用尺子,好司机开车的时候不是还要背交通法规。

    回复
    1. 回复

      谢谢关注。1%是根据个人经验,是没有依据。你说的方法挺好的,可是可能没有往年的网络在线考研培训数据。

    2. 回复

      不明白层主说的四个百分比得出他们之间的关系是什么意思。

      ——还有实际上是调研前三年的数据。不仅要算增长率来推算数值。还要考虑增长率变化值。

  9. 之前看过类似的题,主要入手就是从总数入手,看到有别的人说可以用抽样的方式,不知道可行吗?十分感谢~

    回复
    1. 回复

      :grin: 谢谢关注。说一下我个人的想法:如果题目是给你一定的时间一定的资源比如几天或者多少人力,去估算,抽样的方式经过了实际的验证,肯定比较准确。本题如果是要你当场给出估算结果,抽样就不行了。另外,抽样的思路也是一样的,对于用户要做足够的细分。对于不同的用户画像,都要全盘考虑到。

    2. 回复

      是的是的~用户画像很重要,当时确实没有考虑到一本二本不同情况下的流失率。还有就是数值的问题,就像老师提到的130所一本院校,这是估计的值,还是确实研究得到的值呢?在考试的情况下,我貌似只能自己猜一个了哈哈……或者写上这个值可以通过网上查到,这样是不是不太好呢 :oops: 谢谢~

    3. 回复

      130是大致估计的。可以结合自己的经验来猜。如果实在没有数据,可以退而选择用抽样的方式。样本选择要足够细致。

  10. :arrow: :arrow: 最后做这题的时候只有3分钟了 :cry:

    回复
    1. 回复

      时间规划和进度控制也是产品人重要的能力,拿到题目后可以大致估算一下每个题花的时间,控制好节奏。 :grin:

  11. 完全没答对,主要是时间根本不够 :cry: :???: :cry:

    回复
    1. 回复

      没有标准答案,主要是思路。 :grin:

加载中