为什么产品运营那么依赖ABTest，而风控不需要？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

为什么产品运营那么依赖ABTest，而风控不需要？

雷帅

2021-10-13

3 评论 7111 浏览 28 收藏

10 分钟

编辑导读：ABTest是互联网行业的常用手段，通过高频测试找最优，ABTest就是协助我们衡量需求收益的好朋友。相比于产品运营高频使用ABTest，风控比较少用到ABTest，这是为什么呢？本文作者对此进行了分析，与你分享。

大家都知道流量时代，互联网产品、运营都在干嘛呢，高频测试找最优。即使我们不知道背后的统计学原理，我们也对ABTest耳熟能详。

在产品做一个功能或需求时，听到最多的疑问就是：你这个功能/需求能带来的收益是什么？收益能有多大？那我们怎么去衡量一个需求带来的实际收益？这个时候，ABTest就是协助我们衡量需求收益的好朋友。

那风控模型策略上线做不做ABTest呢？大家可以想一想。

我曾经有过一次面试经历，对方问我，之前有没有做过ABTest，我说有。然后要我举个例子，我想了想，意识到不对劲，瞎解释了一通。

因为风控策略其实并没有真正意义的ABTest。

一、ABTest

运营同学想测试：banner高度是否影响点击率？
设计同学想测试：不同分享按钮的颜色能不能提升点击率？
大数据同学想测试：不同推荐算法的点击率啊？

ABTest将不同的用户分成不同的组，同时测试不同的方案，通过用户反馈的真实数据来找出哪一个方案更好。解决的是多种方案需要拍脑袋确认哪一种更好的问题。

对一个产品设计，往往已经能难直观判断是否真的是一种优化了，这个改变，可能来自文案、按钮的颜色、界面的布局或者功能的迭代，也可能是推荐算法。

你说你知道哪个更优？

只能是骡子是马，拉出来比一比。

根据这些思想，ABTest有几个关键，一个是分流，流量要分配的公平，一个是检验，要验证结论具备统计学意义。

ABTest的统计学知识就不写了，随便一搜都有，而我也不会。

值得注意，ABTest是验证想法方案的策略，而不是战略。

它不能解决所有问题，因为它并不适合所有情况。

更改登陆页面可能是一个很好的ABTest候选者，更改网站或表单上的按钮位置可能也是一个很好的ABTest。一个完整的网站重新设计可能是也可能不是一个好的ABTest，这取决于如何进行实验。

通常，增量更改非常适合ABTest。注意，缺陷也隐藏在其中，增量测试显然容易陷入局部最优。

最常用到ABTest的就是增长部门，那什么时候应该引入ABTest呢？应该是在找到了一条相对比较可靠的增长路径之后，通过ABTest来优化这条路径。

二、产品 & 运营

有人总结产品和运营的关系，产品是把东西做出来，运营是把东西卖出去。有点意思。

不管是产品还是运营，可以统称为增长，它们都是为增长服务的。而上面刚说，增长非常适合ABTest。

比如电商行业中典型的增长问题，提升页面转化率，包括提升列表页到商详页的转化率，商详页到订单确认页的转化率，订单确认页到交易成功页的转化率。

这整个流程中太多ABTest的用武之地了，从icon，到文案，到页面结构，到推荐结果，等等。可以说产品体验5要素的很多内容都需要经过测试。

再比如，电商平台为618、双11促活，想知道是用满减券好，还是折扣券好。这两种券，可能在不同品类的商品、不同客群上效果都不一样。

实际上，很多用于测试的选项你是真的不知道哪个好。

据说，google的设计师不能在两种颜色中做出取舍时，他们测试了41种不同深浅的蓝色。

意料之外情理之中？

我们看下工作中典型的产品&运营工作流，以电商场景为例。

产品和运营同学日常，统计电商搜索结果页面的PV、UV、曝光、点击等数据指标，发现该页面搜索结果的转化率很低，即很多用户进行了搜索却没有点击搜索结果进店购买。

随后运营同学对用户的行为数据和各项指标展开分析，定位问题并进行头脑风暴，提出多套可行的的改进方案。

之后通过ABTest同时将这些方案发布到线上运行，并记录实验日志，计算转化率等指标，最后通过分析各个方案的效果指标得到最佳方案。

总结一下，这个工作流可以概括为，发现问题->提出目标->建立假设（提出优化方案）->AB实验->验证假设，若假设成立则上线新方案，若不成立则继续头脑风暴提出新方案再进行实验。

通过上面的分析，可以发现ABTest已经成为数据驱动增长的必要工具。

三、风控

我只是想写这一部分，不知道为何要先写前两部分。

风控中，做一个新模型，或者一条新策略，都是要充分评估更优的。迭代的模型要跟很多东西对比，首要对比的就是想要替换的模型。策略的优化第一个要比的也是原策略。

没有得到更好的模型效果或者策略效果，别说上线了，你都不好意思说你做了这个工作。

当然，这里存在幸存者偏差，我们是在“幸存者”上确保了B好于A。

你看，这根本就不是传统ABTest的工作流，不知道好坏，只能靠上线分流测试。

根本问题出在哪呢？

ABtest的原假设是组别间没有差异，备择假设是有差异，目标是拒绝原假设，核心是证伪。

而风控策略呢，很可能是AB没有明显区别，也会接受B，因为B的设计更简化、更清晰、更轻维护。

增长里B方案的提出是脑暴式的，而风控里的B方案却是呕心沥血出来的。也许是更复杂的算法，也许是更精细化的特征挖掘，也许是目标定义的改变，等。不管是哪一种，一定是为了更好而做的B。当然，不排除即便如此，仍然出现了B不如A的尴尬局面。

这是风控和增长的前提差异。一个是没有差异就拒绝，一个是没有差异就接受。

增长本质上是通过ABTest的思想，把产品决策权交给了用户。风控并非如此。

风控的新策略不需要保证新的业务指标显著优于原有业务指标，即使没有显著差异，仍然可以上线新策略。

背后的根本原因是，这些都是不和用户交互的，不像产品层，新的UI不比原UI高效则不上。

结果是，产品，除非确认有效，否则就不上，而风控，只要没有负面影响，就上。

这并不是说风控里就没有ABTest。

风控决策引擎里面的ABTest，一般叫做冠军挑战者。只是因为上面提到的这些原因，冠军挑战者起的作用只是图心安而已。绝大多数都没有起到什么价值。

大家做风控，不管是模型迭代，还是一个确定的策略工具迭代，例如偿债能力，我们评估风险区分性，评估换入换出，评估通过率，评估这评估那。这些都是线下完成，而非线上测试。

本文由@雷帅原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

雷帅

公众号「雷帅快与慢」，WX：thunderbro，幸会

48篇作品 250149总阅读量

To G 产品的标准化如何做？(下篇)

09-072920 浏览

言中了几条？——“2022中国互联网十大预测”年终回顾

01-046889 浏览

小红书的“买手”电商，远水难解近渴

11-073638 浏览

PDCA循环，在开发产品功能中的运用

07-317494 浏览

我用低代码平台，搭建了一套管理系统（含需求分析过程）

10-177347 浏览

边度浮华

看了好像有一点理解，但细细再看，又发现不能理解

最近来自广东回复
ostri👣

作者好，第三部分没太看明白，
1、而风控策略呢，很可能是AB没有明显区别，也会接受B，因为B的设计更简化、更清晰、更轻维护。——相当于有优化成本
2、风控的新策略不需要保证新的业务指标显著优于原有业务指标，即使没有显著差异，仍然可以上线新策略。——没有任何优化？
3、增长里B方案的提出是脑暴式的，而风控里的B方案却是呕心沥血出来的。也许是更复杂的算法，也许是更精细化的特征挖掘，也许是目标定义的改变，等。不管是哪一种，一定是为了更好而做的B。——就是说风控B方案一定是主观上优于原方案
那到底是风控要求优化才能上线，还是无差异就可以上线？如果无差异就可以上线，似乎跟上面写的ABTest一致？

最近来自北京回复
1. 雷帅作者回复ostri👣
  
  其实强调的就是一件事情，风控的优化不一定是效果上的，方案本身的简化也是重要的优化，也就是说优化了决策过程，不一定优化了决策效果。所以，
  1、你说的对，风控的B是有优化成本的；
  2、就是指方案本身优化了，效果没有显著差异，也是可以的；
  3、主观上这个词用的准也不准，主观上优于是方案的优化，无差异是效果的无差异。“如果无差异就可以上线，似乎跟上面写的ABTest一致？”这句话不对，ABtest是上线测试，不是上线B替换A，风控效果无差异就直接上B换A了
  
  最近来自北京回复