A/B测试算法大揭秘 | 一切都从这个定理开始 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

A/B测试算法大揭秘 | 一切都从这个定理开始

吆喝科技

2016-07-28

2 评论 13130 浏览 61 收藏

5 分钟

对于通过A/B测试来优化产品的用户而言，置信区间无疑是最关注的元素之一，它可以反映出试验版本与对照版本之间的真实提升范围。但是置信区间背后的原理，以及具体的计算方法是怎样的？从今日起，我们将为你逐步揭开置信区间的神秘面纱，解答你的疑惑。本文是第一章，一切先从奠基性的定理——中心极限定理说起。

关于正态分布

在正式介绍中心极限定理之前，需要先了解一下什么是“正态分布”。

以掷2颗骰子为例，对所掷的点数求和并将数值在坐标轴上标记出来，当掷出次数增大到无限时，坐标轴上的散点就会呈现出“正态分布”的形式。

因其曲线形态呈现出两头低、中间高、左右对称的样式，正态分布又被称为钟形曲线。它是概率分布函数里最重要的一个分布类型，体现了随机性的最基本规律。

在正态分布的表达式中，有几个比较重要的参数：样本均值x、总体均值μ、方差σ。纵轴表示概率密度，横轴表现随机变量的值，曲线与横轴间构成的面积求和为1，表示所有可能的取值加起来的概率是100%。

其实，正态分布在生活中有着相当广泛的应用：如根据考生成绩的正态分布规律来判断本次试卷的命题难度，凭借同质群体的身体机能状况来界定医学参考值范围等。

两种青年对中心极限定理的两种表达

那我们今天的主角——中心极限定理，与正态分布有什么联系吗？

关于中心极限定理的表达方式其实有很多种，在这里，我们选取了和A/B测试较为相关的两种表达，供大家参考：

普通青年：从总体中随机抽取一个样本量为n的样本，当n充分大时，样本均值的抽样分布近似服从正态分布。

普通青年对于中心极限定理的理解较为直观，但对于某些随机变量来说，简单的样本均值分布并不满足正态分布的形态。

针对随机变量的具体分布情况，文艺青年有着更为科学的见解：

多个相互独立的随机变量，他的均值（和）的分布是以正态分布为极限，也就是逼近正态分布，与随机变量的具体分布无关。

也就是说，无论现有的样本数据是什么样的分布，只要通过均值或者和的方式对变量数据进行组合转换，最终得到的具体分布类型肯定是正态分布状态。所以我们在处理相关数据时，并不需要这个数据一定是正态分布的表现。

1656dc8e348025a380adf1b48b032b02_b

中心极限定理在A/B测试中的应用

中心极限定理是概率论中最重要的一类定理，它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理，之后的推导公式都是不成立的。

事实上，以上对于中心极限定理的两种解读，在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。

对于属于正态分布的指标数据，我们可以很快捷地对它进行下一步假设检验，并推算出对应的置信区间；而对于那些不属于正态分布的数据，根据中心极限定理，在样本容量很大时，总体参数的抽样分布是趋向于正态分布的，最终都可以依据正态分布的检验公式对它进行下一步分析。

不过，了解了中心极限定理，只是完成了最基础的部分。要想真正了解A/B测试和置信区间，还需要走很长一段路。第二章，我们将向你讲述假设检验。

作者：王晔，吆喝科技创始人兼 CEO

本文由 @王晔原创发布于人人都是产品经理。未经许可，禁止转载。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

吆喝科技

吆喝科技，AB测试云服务。

35篇作品 522641总阅读量

希尔伯特旅馆里，住着AI的某种真相

05-291315 浏览

希尔伯特旅馆里，住着AI的某种真相

经验｜5 个方法，帮你打破 B 端竞品调研壁垒！

04-245620 浏览

经验｜5 个方法，帮你打破 B 端竞品调研壁垒！

从战略、管理、业务、产品这4个维度，思考从0到1的产品设计

01-316753 浏览

从战略、管理、业务、产品这4个维度，思考从0到1的产品设计

电池银行：新能源行业的全新商业模式

07-176121 浏览

电池银行：新能源行业的全新商业模式

被3·15点名，破解版APP真的凉凉了

03-177529 浏览

被3·15点名，破解版APP真的凉凉了

评论

汪仔6541

测试用例

最近来自河北回复
磊叔

好多统计学的知识~~~能不能写分享一篇统计的理论呢？ 😀 😀 😀

最近来自广东回复

2023，消失的超级网红

08-187019 浏览
AGI时代的关键变化和机遇：深化洞察力，提升产品管理能力

07-272866 浏览
谈谈线下场景中的数据分析思路

02-095580 浏览