搜推策略产品十做十不做

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

元气

2022-11-28

2 评论 5138 浏览 42 收藏

产品经理的职业发展路径主要有四个方向：专业线、管理线、项目线和自主创业。专业线是指沿着技能线不断提升自己..

搜索推荐到底该怎么做呢？是要照着老板说的做，还是根据用户反馈做？本文作者总结了搜推策略产品的十做十不做，并对其中的三点进行了分析，一起来看一下吧。

搜索推荐到底怎么做？按老板说的做，照竞品抄，根据用户反馈做、通过数据分析做？8年京东、美团搜推经验，建议大家那些该做，那些不该做的，搜推策略产品十做十不做，但要根据具体情况定。

01 硬加权不做，但柔性智能化流量调控要做

什么叫硬加权，就是给某个商品的排序直接从后面提到前面，这个叫硬加权。比如有运营来找你，说我这个东西这么好，怎么排序靠后呢，你得给我加权呀、或者是某个业务找到你，说我这个业务是今年公司重点，但流量不足呀，你得加权呀……

为什么不能硬加权，硬加权损效率呀！为什么损效率呀，用点黑话，是因为用户不Buy in呀，就是用户不点呀！

那为什么柔性智能化流量调控可以做呢？这有几个关键点，一个是前置的筛选分层，如果是电商就是精细化选品，看哪些品是预期可以多获得一些流量，也能承接得住的。

比如阿里今年双11出了一个价格力加权，就是你这个商品优惠力度大，我可以多给你流量；再比如阿里的优质商家商品流量加权，也是说这个商品有一定的潜力，我多给他一些流量，应该也能承接的住；还有就是中间的赛马机制，效率好的晋升，效率差的汰换，同时要有运营诊断指导，为什么效率差，商品价格高、没什么评论积累、主图标题不清晰等。

当然还有很多，不一一展开说了。还有一个重要的点是，对于协同部门要疏不是堵，就是你给他提供抓手，可以让他有玩的东西，然后一点一点有轶序地玩。

02 乱七八糟标签不用做，但用户商品基础标签、营销标签、人群节日标签要做

什么叫乱七八糟的标签？就是一提起推荐，大家就说你是基于那些标签推荐的，我们能不能在商品或内容上打些标签，然后你们用呀？我们之前打的标签你们用了吗，效果怎么样？你看我们还需要打什么标签……这里说明下，标签对于推荐来讲是重要的，但不是最重要的，尤其是在大数据量的情况下。所以，不要提到推荐，大家就认为标签做好了，推荐就做好了，推荐没做好，就是标签没做好。

1. 推荐原理

回答什么是乱七八糟标签前，我先基于我的理解给大家科普下推荐原理。其实这也不能怪大家，早期推荐技术也没那么先进，然后数据量可能也不多，所以，大家就冷启的时候让你选兴趣点标签，推荐的时候根据文本标签推荐，模型上也是LR、GBDT一类的。

这就让没搞过搜推的人觉得，啊，推荐就是标签推荐，但他不知道，现在都是DNN了，都是基于用户行为推荐，基于I2I推荐，基于KNN，基于Embedding、Vector推荐，只有个别情况下，数据挖掘不到的，才会通过早期的文本标签做召回推荐。

举些例子吧，要不然，这么说，懂的人懂，不懂的人还是觉得推荐就是标签推荐，推荐没做好，就是没标签，或者标签不准，或者标签用得不好……那以电商为例，基本可以通过共购买，共点击等数据挖掘到相似或相关的商品。

比如你点击了小米的手机，那可能会推荐给你华为的手机，因为很多人点了小米后，也会点华为，甚至最后还购买了华为，这么说还是笼统，更细节是你点的是小米支持5G的，8G+512G内存+存储的、5英寸的、双摄的……那算法就通过大数据帮你找到的是华为P40\P50，而不会找到Nokia。

那你这例子不还是说推荐就是基于标签推荐的吗？这里其实又涉及到了算法可解释的问题，通常业务会问，你这排序的逻辑是什么，为什么这么排，为什么这个排前面，那个排在后面？你看给我推了这个，你看我是这样的用户，我年薪百万，怎么不给我推那个？你这个推的多Low呀，一点都不高端……那算法同学呢，一般的回答就是，呃，这是算法推荐的，是DNN深度学习的，是黑盒的，是不可解释的，我们也不知道为什么这么推；产品经理呢一般会说：啊，你点过这些吧，这是根据你的行为和画像推荐的。

2. 模型可解释

我先捞干的，理论上DNN深度神经网络是不可解释的，不像GBDT的树模型那样是可解释的，这说的是从模型的角度，什么Feature Important角度是不可解释的。但实际上任何模型也都是可解释的，因为人的选择是可解释的，人的购物决策和浏览内容的偏好是可解释的，只不过是你要根据不同人、不同时间、不同地点、不同场景、不同……太多了，这样就不好解释了，而且你还是要解释给不了解算法的人。

那这就变成，本来是可解释的也解释不清楚了，或者解释清楚了也听不清楚……大部分情况下，排序就两种结果：有用户行为的非新用户就是点什么推什么，无行为的新用户就是热门推荐。

就像行业里的头条、抖音、快手什么的，早期甚至现在都是你第一次打开就是美女、时效热点事件、当地特色内容等；然后你就一直看，算法就认为你喜欢，就一直找相似的推；然后你美味佳肴吃够了，偶尔也想来点粗粮，这时你就划掉那些美女了，或者自己搜索点什么，那算法就认为你喜欢上其他内容了，那就帮你找新的相似的内容。

但这些说的都是表面哈，我来讲点深度的。其实算法里有个概念叫特征，特征是什么呢？就是能表达这个商品或者内容好坏的东西，其实就像“白、富、美”就是表达一个女人的特征。那算法里一般用什么特征呢，比如内容类关键的就是点击量、点赞量、评论数、点击率、完播率、停留时长、好评率……然后这些特征呢，还有周期，比如7天点击量、3天点击量、1小时点击量等。好这样估计有些人能理解推荐一些了。

03 为了多样性而做的多样性不做，但基于人群、用户行为、时令节日、空间等变化的多样性要做

1. 什么是多样性

一般推荐结果的多样性就是，连续Top N个结果是不同的，不同的维度一般是类目维度。这个是通俗的定义，如果要科学定义的话，其实是通过基尼系数、熵等来衡量的。

这里再多说一些多样性，仅是类目维度的多样性还不够，有些场景下需要下分到二、三、四级类、甚至是词维度，同时还可以根据图片、价格、商家、品牌、属性、作者等等很多维度不同的多样性。那大家如何理解多样性的呢？这里就会根据不同的屁股、不同的认知来理解了，抽象地讲没有感觉，我举些例子，做为推荐产品经理遇到比较多的情况应该是：

1）老板觉得多样性不够

这里多吐槽一下，在互联网公司推崇扁平化、去官僚化的情况下，做为一个底层人员，仍然要面对很多层级的老板，而且这些老板们的想法还都不一样，想法不一样也就算了，关键是他们还不听一线人员的方案。一般打仗是在前线的人员，最清楚状况，最知道怎么打，且将在外，军令可有所不从，但你在互联网公司，你要敢不从，那你就等着走人吧。

那老板们都如何理解多样性呢，比如甲老板会说，这怎么每天都给我推差不多的内容，我们平台上不是有很多内容吗，我们那个主推的怎么没看见；乙老板会说，一样的内容推得太多了；丙老板会说我在其他平台上看到的内容，咱们这怎么没推呢……

2）业务觉得多样性不够

业务经常是说，怎么没有我们品类的内容呢，怎么都是那个品类的内容呢？

3）用户觉得多样性不够

很多用户是不愿意反馈的，一般也就反馈点什么推什么、看过买过还推。

2. 如何做多样性

前面虽然提到了什么叫多样性，但不够具体，所以，在如何做前，还是要定义清楚什么是多样性，做到什么样，大家能满意。这里先说那些不是多样性不够：

1）不区分场景的多样性不是多样性问题

老板们不分任何时候，都想要多样性，这里有一个经典的场景，比如某个用户此刻想买个冰箱，或者是想了解某个事件，这时你非要为了多样性，再给他推荐个洗衣机、电视，虽然都是家装三件套，但这个用户可能不是新装修呀，有可能就是想换个冰箱，或者是给家里人买、或者是放到租房的地方，反正他不缺电视。

那你说想买上衣的时候，推荐裤子可以吧，这个场景看似成立，但不是适合所有用户；那这种跨品类的，组合式的推荐什么时候成立呢，这个要根据每个用户的意图强弱，行为丰富度等来动态判断。比如用户就是逛，就是什么都点，那基本上，你的推荐就可以发散一些，否则，有明确意图的，你就要帮他收敛，快速帮他找到他想要的，可能是他有一个价格心理，或者是一个属性风格的心理。

2）行为与意图茅盾的不是多样性问题

什么意思呢？就是经常有些内部的人，他不是想看真的内容或者购买那个东西，而是没有目的地乱点、乱看，点着点着，自己也忘了都点过什么，然后算法基本会基于你最近的点击等行为进行推荐。且由于算法贪心的Point wise模式，推荐的内容确实会是相似的多，这样就会造成错觉，怎么给我推的内容都差不多？

这里的差不多，就是上面说的，算法会基于行为推荐类目相似、价格相似等的内容，但老板要看到的是不同价格段的都来点，或者其他想法，反正是有自己的想法。有时能代表用户，但更多时候是参杂着自己的意愿，以及平台的导向。

比如也会说咱们平台不是还有很多内容吗，这里其实你可以建议你的老板去内容库或者商品库里看全部内容，推荐算法不可能把全部分类都推出来，那和过去的货架式、陈列式没什么区别了。

我们继续说多样性如何做。做之前呢，要知道目标，做到什么标准算好，那这里基本上是需要定量和定性去衡量的，比如定量上要提升浏览深度、CTR、停留时长、不同品类的曝光占比等，不同业务可能不太一样，定性上是否明显的Badcase在减少等。

有了衡量标准后，就是具体策略了，这个策略也要从多层进行制定，基本上推荐要想优化一个问题，都是要全方面的调整，不可能有一个大招，就解决所有问题，那一般都是从数据、召回、排序、交互上去优化：

1）数据

数据这不多说了，核心是三点，数据要全面、准确、实时；你要搞清楚人的画像和商品内容的画像，要不然无法进行准确的召回和匹配。

2）召回

这里要多说一点，召回源是推荐最重要的部分，如果你只有一路相似召回，那你就没法做多样性。至少要按人群、时间、空间、场景等维度进行差异化的召回，比如新人召回热销、或者基于CF的召回；非新更多是基于用户行为的相似相关召回。

还有些人会深度将人群分得更细，比如阿里的八大人群。从时间上会基于平日、季节、节日、大促、热点、上新等进行召回；从空间上会基于LBS召回；场景上则会比较多，比如是用户动线购前、中、后等，用户需求的具体场景，比如办年货、吃火锅等。除了这些召回外，还有一些更偏算法的，比如KNN，KG，Base Model CF。

3）排序

这里和多样性相关的应该是模型由Point wise调整为List Wise，以及通过MMR等进行打散的排序，还可能加入一些硬规则的M出N的排序，然后EE和生态排序也可以算到这里。

4）交互

这里最重要的是，要实时捕捉用户的正负反馈，根据正反馈加强推荐，根据负反馈削弱推荐；同时要在产品交互形态上做到动态交互，既用户点击某个Item后回到列表页时，下一个如何进行动态的推荐；以及用户翻页时，要进行重新推荐，这里有些会使用端智能，但感觉端智能还是提升有限，最好还是进行服务端重新的推荐。

总结一下多样性的要点：