正态分布在用户等级划分的应用

Vector
4 评论 17320 浏览 78 收藏 4 分钟
大厂导师团亲自授课,超过200小时的精品课程,从0到1为你构建“产品+业务”的复合型知识体系,让你在职场竞争中脱颖而出。

为了便于描述和应用,常将一般正态分布转化成标准正态分布。通过查标准正态分布表,就可以直接计算出原正态分布的概率值。

  • 问题:根据用户播放时长,划分若干等级。目前可使用的数据为日人均播放时长。等级从低到高,要求达到的时间越来越长。
  • 理论:日人均播放时长符合正态分布,可通过绘制QQ图验证。

正态分布图如下:

可知,3σ原则为:

  • 数值分布在(μ-σ,μ+σ)中的概率为0.6827
  • 数值分布在(μ-2σ,μ+2σ)中的概率为0.9545
  • 数值分布在(μ-3σ,μ+3σ)中的概率为0.9973

即x≥μ-σ的发生概率约84%,x≥μ发生概率约50%,x≥μ+σ发生概率约16%,x≥μ+2σ发生概率约为3%。

实践:

本例中要求划分为4个等级:

  • 第一步,取某足够长时间的播放数据;
  • 第二步,计算日人均播放时长(分);
  • 第三步,计算日人均播放时长的平均值μ=62和标准方差σ=12.5;
  • 第四步,计算3σ分布。

  • 第五步,得出各点的概率。

  • 第六步,计算最终时间,单位:分钟。

解释:

理论上来讲:

  • 84%的人一周后获得第一个等级;
  • 50%的人一个月后获得第二个等级;
  • 16%的人6个月后获得第三等级;
  • 3%的人12个月后获得第四个等级。

小结:

  • 第一个等级350分钟——即5.8小时;
  • 第二个等级1860分钟——即31小时;
  • 第三个等级13500分钟——即9.4天;
  • 第四个等级31755分钟——即22天。

展望:

由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率,只要会用它求正态总体在某个特定区间的概率即可。

为了便于描述和应用,常将一般正态分布转化成标准正态分布。通过查标准正态分布表,就可以直接计算出原正态分布的概率值。

根据该理论可以实现任意等级的划分,只需将正态分布转为标准正态分布,根据每个等级可达到的概率进行查表获得相应的分界点。

 

本文由 @Vector 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. “84%的人一周后获得第一个等级;50%的人一个月后获得第二个等级;16%的人6个月后获得第三等级;3%的人12个月后获得第四个等级。”
    请问一周、一个月、6个月、12个月这个的依据是?求科普

    来自北京 回复
    1. 依据是你希望多少人达到的。

      来自山东 回复
  2. 为什么简单的一个分层讲这么复杂

    来自上海 回复
    1. 简单背后有依据

      回复
专题
15627人已学习13篇文章
如果做小红书运营?本专题的文章分享了小红书流量密码。
专题
15173人已学习13篇文章
交互设计是用户与产品以及他们使用的服务之间建立的有意义的关系。
专题
18355人已学习13篇文章
本专题的文章对整个商业模式进行了一个清晰的梳理和设计,并说明了商业模式如何变成可执行的路径。
专题
12452人已学习12篇文章
很多公司都在谈论数字化转型,而数字化的基础即是大量的、繁杂的、高度业务关联的基础数据。数字化运营是其中的一个分支。本专题的文章分享了如何做好数字化运营。
专题
12821人已学习12篇文章
瑞幸咖啡和茅台的这次联名合作,无疑让联名营销这类营销方式又掀起了热度。本专题的文章分享了联名营销指南。
专题
14640人已学习14篇文章
在很多产品中,搜索都是其中比较基础且很重要的一个功能。搜索的设计、逻辑、交互等问题也是需要特别注意,本专题的文章分享了电商搜索功能的设计指南。