最大化A/B实验成效：这个方法绝对不能忽视 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

最大化A/B实验成效：这个方法绝对不能忽视

2024-04-07

0 评论 1107 浏览 3 收藏

技术知识、行业知识、业务知识等，都是B端产品经理需要了解和掌握的领域相关的知识，有助于进行产品方案设计和评估

想象一下，如果能预先知道哪些实验最成功，并将资源和精力集中于此，会对你的增长效能产生怎样的影响？本文将告诉你，如何利用ICE模型让你的每一次实验都能产生最大的效益。

ICE模型是一种对实验想法进行优先级排序的综合评估框架，其目的是帮助我们最大化实验效果。

ICE三个字母分别代表：影响力（Impact）、成功概率（Confidence）和易实施性（Ease）。

通过对每个实验想法从这三个维度进行打分，并综合得到总分，我们就可以对实验的优先级进行排序。

一、ICE模型定义

1. ICE模型定义媒体

（1）影响力

指的是实验成功后对关键指标的提升程度。主要考虑两个因素：实验覆盖的用户量以及实验能够将指标提升的幅度。

（2）成功概率

取决于是否有充分的数据洞察支持实验假设。数据来源可以是定量数据、定性数据或行业最佳实践等。

B端究竟需要什么样的产品经理？

B端产品经理都是以提升供应侧的工作效率为目的，所以B端需求主要是以业务问题为导向。这个是B端产品比较重要的一点，B端产品是服务于一个主体 ...

（3）易实施性

需要考虑上线实验需要投入的各项成本，如研发资源、设计资源、经济成本等。我们希望以最低的成本快速验证实验假设。

2. 通过ICE模型进行实验想法评分和排序

针对每个实验想法，从影响力、成功概率和易实施性三个维度打分，再综合得到总分。总分越高，代表实验想法的优先级越高，越值得优先执行。

要注意的是，在做增长实验想法优先级排序的过程中，不要去盲目的追求精确性。

因为 ICE模型或者其他的一些优先级排序的模型也好，都只是一个参考的框架，不是一个绝对的科学，不需要花太多的时间去追求每个打分的绝对的完美和科学，而是要把重点放在提高实验频率和数量上。

二、ICE模型应用案例分析

接下来我们通过一个案例，演示如何利用ICE模型对实验想法优先级进行排序。

1. 提升新用户预定成功率的实验想法

假设我们是一个订房网站，希望提升新用户预定房间的成功率，现有以下三个实验想法：

（1）微信一键登录功能的开发

我们发现很多新用户在注册环节就流失了，考虑开发微信一键登录功能以优化注册流程。

（2）页面上添加全网最低价保证

通过在页面上添加全网最低价的标语，降低用户对价格的顾虑，促进用户下单。

（3）为热门房源添加精选标签

对热门房源添加醒目的精选标签，吸引新用户点击和下单。这三个实验想法初看都有一定道理，但资源有限，我们需要决定先做哪个，后做哪个。此时就可以借助ICE模型来评估每个想法的优先级。

2. 订房网站实验想法的ICE评分

1）微信一键登录

高影响力、高成功概率、中等易实施性

影响力：9分

微信一键登录可以显著提升新用户的注册转化，覆盖几乎所有新用户，影响力很大。

成功概率：9分 wsc

微信登录已是主流APP标配，成功概率非常高。

易实施性：6分

开发微信登录需要一定的研发资源投入，易实施性中等。

ICE总分：24分

2）全网最低价保证

中等影响力、高成功概率、高易实施性

影响力：7分

全网最低价承诺可以直接影响用户下单决策，且如果展示在一些高流量页面比较明显的位置，那预期的影响会更大，但相比登录环节影响力略低。

成功概率：9分

价格优势承诺符合消费者心理，成功概率很高。

易实施性：8分

只需修改页面文案，易实施性非常高。

ICE总分：24分

（3）精选标签

中等影响力、中高成功概率、较高易实施性

影响力：6分

精选标签可以在一定程度上引导用户选择，但相比价格承诺，影响力稍弱。

成功概率：7分

竞品大多有此做法，但精选效果需要进一步验证，成功概率中等偏上。

易实施性：7分

技术实现不复杂，但需要一定的数据分析支持，易实施性较高。

ICE总分：20分

从ICE模型打分结果看，微信一键登录和全网最低价的综合得分最高，达到24分。精选标签得分相对较低，为20分。

综合考虑三个维度，全网最低价承诺无论在影响力、成功概率还是易实施性上都有不错的表现，各项指标均衡，非常值得尝试。

微信一键登录的影响力和成功概率虽然更高，但实施起来有一定难度。所以我们建议优先尝试全网最低价，其次是微信一键登录，最后是精选标签。

增长目标如同瞄准镜中的靶心，ICE模型可以帮你的AB实验更精准地命中靶心。

三、提升实验的预期影响

通过ICE模型，我们可以较为准确地估计每个实验想法的综合价值。但在实践中，我们往往会面临一个问题：绝大多数实验的影响力都不够大。

这主要是因为我们的关注点过于局限在最核心用户身上，而忽视了更大范围的用户群体。比如，一般来说活跃用户只占所有注册用户的 50% 甚至更低，而注册用户其实又是远远小于存在于外部渠道未注册人群的。

因此从这个角度来看，增长实验如果只关心在核心用户上的话，影响力是受到非常大的局限的。

1. 扩大实验的用户覆盖范围

那如何提升影响力？最重要的方法，就是是扩大实验的用户覆盖面，不仅要关注核心用户，更要把眼光放到更广泛的用户群体上。

核心用户虽然是产品的中流砥柱，但在整体用户中的占比往往不高。我们要主动将视角扩展到活跃用户、注册用户、过客用户，甚至尚未接触产品的潜在用户身上，积极为这些非核心用户策划有价值的实验项目。

比如Airbnb就开发了很多面向非房客用户的功能，如旅游攻略、社区论坛等，以扩大实验的触达面。

2. 利用高流量页面和路径进行多次实验

要想撬动更大的影响力，第二个方法就是锁定高流量页面和用户路径，在这些关键节点上反复实验，持续优化。因为这些位置聚集着大量用户，每一次小幅优化带来的效果提升都会被放大。

举例，咪咕视频为了提升APP下载量，针对下载页反复进行AB测试。最终，相比初始版本，优化后的页面点击率提升了56%。可见在高流量页面上，持之以恒的实验优化，往往能收获惊人的效果。

其实平时的工作中就可以有意识的去找各种关键路径，一般来说漏斗上游的路径，新用户注册激活的路径，购买转化的路径等等都是值得去做多轮实验反复提升的路径和页面。

四、提高实验的成功概率

ICE模型中的C代表成功概率，即实验达到预期效果的可能性。我们在设计实验时，一定要尽可能提高成功概率。而这需要扎实的数据洞察作为支撑。

回归到上一篇文章，讲的就是如何从数据中找到足够有力的洞察和支持，包括各类定量和定性的分析。

定量数据能揭示用户行为模式，定性数据如用户反馈则能还原用户心理。除此之外，竞品分析、行业报告等也能为实验假设提供有价值的参考。唯有将各类数据高度整合，才能真正洞察用户需求，找到最有可能成功的解决方案。

举例，如果我们想要测试是否延长订单支付的有效时间，可以提升订单支付成功率。

首先可以通过数据分析，观察不同支付时效下的订单支付转化情况。

其次可以收集用户反馈，了解他们对支付时限的看法。

最后再参考同行业优秀产品的做法，形成完整的决策依据。

五、降低实验的实施难度

除了影响力和成功概率，易实施性也是评估实验价值的重要指标。资源总是有限的，我们需要以最小的成本，最快地验证实验效果。最好的方法就是通过 MVP 的方式与最低成本去验证实验假设。

1. MVP（最小可行产品）策略的应用

MVP的核心思想是用最低成本快速开发原型，尽早与用户见面，通过获取用户反馈来验证产品假设，进而不断迭代优化。

这种策略也非常适用于增长实验的设计。设计增长实验 MVP 的时候，你要去考虑2个问题：

1）如何用最小资源快速验证假设

如果实验假设可以仅通过数据分析就证明或者证伪，那这个其实也是增长实验的MVP，你甚至不需要去开发这个实验，只是通过数据就证明或者证伪了，这也是非常好的结果。

如果无法通过数据分析直接验证，是否有可能不用做完整的版本，而是开发一个小版本，就足以验证假设是对的还是错的？

2） MVP实验是否能提供可信的决策参考

我们需要的是有效的结果和洞察，所以不能把实验的版本过分简化，导致最终的结论不完整，无法证实或证伪实验想法，那这就不是一个可信的增长实验MVP。

2. 个人化注册流程的MVP设计案例

实验假设是不同的用户画像需求不同，需要设计个人化的流程可以更好地满足需求，提升成功注册转化率。

针对这样的实验假设，如果贸然开发一整套个性化方案，会发现工程资源投入、设计资源投入、数据资源投入都是非常高的，那增长实验的容易程度的得分就会非常低。

所以，不妨想办法把它转化成一个轻量级MVP。比如只选 25 岁左右的女性，只针对这种人群来做个人化的注册流程，然后对该人群进行小流量AB测试，验证效果。

如此一来实验资源投入会大大降低，如果提升明显，再扩大实验规模。

3. 无限滚屏功能的反面案例

艾奇是美国的一家创意手工电商平台，他们的产品团队花了半年时间开发出了无限滚屏功能，上线后发现各项指标非但没有提升，反而出现下降。整个团队灰心丧气，最终只能回滚到老版本。

再来一次的话，他们应该怎么做呢？其实可以通过 MVP 方案测试，比如将原本只展示 50 个商品的页面，变成展示 100 个，通过这样的方式去验证是不是更多的商品能够提升用户的购买转化。

所以，更高效的做法是：先小范围试错，观察数据表现，成功后再迭代，而不是一口气追求完美。

从0到1快速验证，从1到100再反复打磨，这是一条极大提升实验成功概率和投入产出比的有效途径。

4. Facebook通过MVP快速验证实验假设

事实上，很多优秀的产品在实验设计上已经形成了一套成熟的方法论。以Facebook的增长实验流程为例，从想法提出到正式上线，每个阶段都经过了缜密的数据验证：

通过各类分析初步验证想法可行性，排除不靠谱的想法
快速开发一个MVP进行小流量AB测试
根据实验结果迭代优化原型
扩大实验流量，进一步验证效果
评估是否达到全量发布的标准

这套流程能最大限度降低实验风险，确保每一个新功能都能经受住市场检验，避免盲目开发。

六、实验优先级排序的实际应用

介绍了ICE模型的原理和案例之后，我们再来谈谈在实际工作中应该如何灵活运用这一工具。

1. 不追求评分的绝对精确，重在提高实验频率和数量

ICE模型的价值在于为实验排序提供参考，而不是追求每个维度评分的绝对准确。我们要把更多时间放在提高实验的频率和数量上，而不是过度纠结于评分标准本身。

一个月能做10个有价值的实验，远比花一个月时间只做1个经过精细评估的实验更有助于增长。大胆假设，小步快跑，用最短时间完成从想法到数据验证的闭环，才是实验的正确打开方式。

2. 形成个性化的排序指标

ICE模型是一个可塑的框架，我们完全可以根据自己的实际情况对评分指标进行调整。比如某些B端产品会格外重视用户体验，甚至愿意为此牺牲一些短期的转化率。这时不妨增加”用户体验”作为第四个评分指标，甚至给予更高的权重。

毕竟实验初衷是为了给用户带来价值，如果实验伤害了用户利益，再高的指标提升也是南辕北辙。

3. 实验想法的定期更新和优先级调整

保持实验想法库的常青，也是一个增长团队应该养成的好习惯。每隔一段时间，就要对想法库进行一次升级迭代，淘汰那些已经过时的想法，补充新的灵感。

同时基于最新的数据分析对实验优先级进行重新评估，确保我们在每个阶段都在优先执行最有价值的实验，而不是被之前的评分所禁锢。

实验成功的要义不在于数量，而在于质量。ICE模型作为实验想法的优先级排序工具，其价值在于能够帮助我们明确哪些实验应当优先执行。

记住三个关键词：影响力、成功概率、难易程度。掌握这一模型，意味着在高速变化的互联网世界中，能够更快地找到并执行那些最有价值的实验假设。

本文由 @小黑哥原创发布于人人都是产品经理，未经许可，禁止转载

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

【增长黑客之道】公号主理人，10年大厂运营专家提供“策略型用户增长”方向求职服务

101篇作品 239608总阅读量

定义关键业务问题，售前的需求调研及方案设计？

03-204279 浏览

定义关键业务问题，售前的需求调研及方案设计？

15000字，详解10个常见的表单设计疑问！（上）

04-106205 浏览

15000字，详解10个常见的表单设计疑问！（上）

UI转产品，涨薪30%，只需90天：我的成功之路

刚刚

警惕技术陷阱，在ChatGPT浪潮里寻找新的“价值感”

04-251699 浏览

警惕技术陷阱，在ChatGPT浪潮里寻找新的“价值感”

如何做好一款基于“双碳”的ToC产品？

04-104312 浏览

如何做好一款基于“双碳”的ToC产品？

Apple Store小程序上线，然并卵

07-122527 浏览

Apple Store小程序上线，然并卵

评论

目前还没评论，等你发挥！

成功跳槽，我告诉你3年的B端产品应该是这样的

60782人已学习20篇文章

如何转行成为产品经理

想转行做产品经理，这个专题值得一看，看看前人是怎么做到的。

12754人已学习12篇文章

如何搭建私域模型？

现如今，越来越多的企业开始重视私域，很多的企业都对私域的发展进行了布局。本专题的文章分享了如何搭建私域模型。

27115人已学习12篇文章

品牌运营：让你的品牌快速占据客户脑海

你说，品牌是什么？

70229人已学习3047篇文章

16827人已学习16篇文章

SCRM工具的搭建以及相关业务运用场景

私域模式已完成从探索到落地的转换，许多企业也纷纷落局。而基于私域衍生出的SCRM工具，也成为私域运营必不可少的利器之一。本专题的文章分享了SCRM工具的搭建以及相关业务运用场景。

20856人已学习15篇文章

AARRR模型的拆解

AARRR模型是一个经典的增长漏斗模型。本专题的文章针对AARRR模型进行拆解解读。