腾讯谭安林:大数据赋能数据增长

1 评论 3840 浏览 6 收藏 24 分钟

7月14/15日,由人人都是产品经理重磅打造的「2018中国产品经理大会 · 深圳站」完美落幕。来自腾讯行为预测负责人@谭安林老师给大家分享《大数据赋能,助力数据增长》话题。

分享嘉宾:腾讯行为预测负责人@谭安林

本文为嘉宾现场分享总结整理内容,由人人都是产品经理社区@Foina 整理,编辑有修改:

 

今天,我想给大家分享一下,在做数据产品这条路上,有怎样的一些思考和实践,以及希望能够给大家带来一些数据增长的启发。

一、TO B 和 TO C

其实,腾讯有一个很好的一个基因,就是to C,比如:QQ、微信。但其实还有一些产品隐藏在后面——to B的产品。

以前的to B的产品,外界没有太多声音,如:腾讯大数据。我们的一些大数据套件,基础的平台能力,一直是在输出给其他的各个BG等的业务线,比如:QQ、微信、腾讯视频、其他的一些快报。

那我们一直在考虑一个方向:要怎样把平台数据服务能力,从外面进行开放?

这里面会遇到一个问题:我们不仅是比较了解C端的用户,在多年内部的支撑的情况下,我们也很了解B端的用户。

  • C端的用户,他更多的希望满足他的某种体验上的需求,比如:聊天、交友、发朋友圈。他只是为了分享一些信息,获得一些成就。
  • 而B端的客户,他是做一个效率的增长。我们要如何减少人力的投入,提高生产效率,花更小的代价去得到更好的流量。

那么,我们会对to B的产品去做一些深入研究,但我们会面临一些困境——一个to B的产品,要怎样把它做成可复制、可克隆的,而不是一个case?

但是,我们的客户其实是to C,那他们想要什么呢?

他们想要的是流水/流量的增长,他们需要去判断一个用户,而我们需要去帮助他们——把用户价值体现出来,发现更高价值的用户转化。

大家经常在朋友圈看到一些广告,其实这些广告其实是有定向成分。

比如:要结婚的人,他可能会看到一些婚纱摄影;要买车的人,他会看到,如:车险、宝马、奔驰等这样的广告——这背后隐藏了一个to B的一个产品,就像微信广告平台一样。

所以我们会去接收B端用户的需求,寻找一个高价值的人群,再去做定向的触达,来提高B端的用户的转换率。

目前,中国的互联网市场已经进入了存量市场,整个活跃的大盘是在12亿左右。

但我们在这种情况下,我们也会去思考——怎样去盘活这些大盘的这种用户,给客户去寻找一些价值点?

两条出路:

  1. 一条的话是出海:像印度东南亚这些市场,它还有人口红利的增长,还是一个增量的市场,还有很大的一个空间。
  2. 另一条是精细化运营:用最小的成本去做最好的一种流量。

二、精细化运营

1. 产品运营周期

这里面就会遇到一些问题:每一个APP都是一个数据的孤岛,要融合起来才会是一个大数据。就算你的数据有百万,有千万,都只是在某一个领域、某一个方向的数据。那么,你要去完整、有效的刻画一个用户是非常难的。

但大数据是什么呢?

平常大家会用到的买C口,或者类似的关系型数据库,进行数据的存储。等数据量变得更大,买C口存不下去了,那就说它是大数据。但其实这个理解也不是错的,可能没有那么准确。

那怎么定义大数据?

它的数据量非常大,但是很多数据无法有效去衡量它的价值,不能直观的去进行使用。比如:我们自己的一个数据,它有可能80%的数据是无法理解的,只有20%的数据能做一些提取,再进行使用。

在大数据的基础之上,才有数据挖掘。

在PC互联网的时代,用户的体验会比较差,营销方式上更多的是一种轰炸式广告。

而现在的C端用户,他们都不是小白用户,会对用户体验有更多的要求;而如果我们还是一种轰炸式的广告,不仅营销预算会浪费,还会让用户投入了竞品的怀抱。

举个例子:在做运营的时候,我们需要对新用户做一些预估,去判断他对哪方面的内容感兴趣;对我们老用户,要做一些洞察,去发现哪些用户是值得去做营销转换。

对现有的客群深入的分析之后,才能知道我们的产品真正转化、消费的群体是哪些,根据这些用户,再去进一步的把盘子扩大,去做潜客的挖掘。

2. 寻找靠谱流量

那我们要如何去寻找靠谱的流量来做推广营销呢?

这时就会有各种各种的媒体渠道,但判断一个媒体它是好是坏,最简单的办法是——转化。但是转化这里面有一个陷阱,适用哪种转化?

假如:我们是一个APP,我们的转化是拉新的转化还是付费的转化,这两个场景是不一样的。

举个例子:我们在帮助客户做数据增长的时候,一开始说是做付费的转化,那我们给你们做付费挖掘出来的人群,会发现评估后它的效果非常的不好。

但是再看后面的转化的效果,它是比较好的。

在这里面的话,我们对转化的定义会有比较多的一个衡量点,要看我们当前产品是处在哪个阶段——是处在需要有更多的活跃用户,还是处在一个就是追求营收的阶段?

回归到靠谱的流量、靠谱的渠道。

在市场上,有三方监测的工具,大家可以去进行使用,比如:品牌效果监测,或者是效果广告检测。在这里面,好的媒体,恶意流量可能在10%以内;但是比较差的,它的某些恶意流量可能在60%,甚至是70%,这都是有可能的。

还有一些其他的方式,比如:一些反作弊工具使用,但这样你的整个评估都会比较滞后。

转化,其实是付费的转化。这样的一个战略的转化,可能是一个月甚至三个月,才会有一个效果的数据。

3. 转化漏斗分析

这是一个转化漏斗的一个分析,做产品、运营时,都会用精细化的转化分析。

以数据产品为例:面向to B的APP用户,投了广告之后,用户从官网到最后我们的成功上线,它是有个过程的,每一个环节它都可能流失。

那么,我们是一般怎么去做内容?

我们会基于用户行为的路径,加上他的画像来进行分析;这两个方式不能解决的时候,我们需要去跟踪问题,去发现它流失的真正原因。

那如果我们的数据不多,但用户量会比较大的时候,去做转化漏斗的分析就会存在一个问题——人力成本会比较大。

假如:你有多个商品,你再看每个商品的转化的路径分析,那投入的成本会非常巨大。

4. 数据建设之路

做数据化的运营,不管是说大小的公司,都会经历这样一个路径。

(1)第一个阶段:基础运营分析

我们要明确每一个阶段的指标,在当前的阶段要做是DAU还是营收。那我们要有:数据支撑、数据采集、APP打点,到最后产品化的一个数据。

(2)第二个阶段:数据挖掘的应用的阶段

这个时候,要投入更大的人力成本,比如:十个人、20个人的一个团队,会包括数据分析、后台开发,还会包括算法模型的同学。那么在这个过程中,需要去构建很多的标签,去建模型,最后进行应用产出。

但这里会有很多的坑,如:标签,你要知道是怎样去构建哪些标签;模型,你要去选择应用的场景,要选择哪种标签把它融入进去,还是要做标签的裁剪。

三、行为预测

1. 核心问题

行为预测,是预测一个用户它发生某种行为的概率。我们目标是——精简我们客户的数据工作,提升产品的效率。

那么,我们会预测哪些用户的行为?

当然是根据B端用户的需求。

如果说客户关注的是当前的池产品,那我们会去促成会员的一个转化,我们需要知道哪些用户是更容易开通会员的。而会员会也分好几种,如:钻石、黄金、铂金这样的一些等级。

那他会更对哪一个更感兴趣?

其实做产品运营,都面临的一个核心问题——哪些用户值得去重点培养?哪些是高价、高净值的用户?

因为只有了解用户,才能做针对性的运营。

那我们要怎样去了解用户?

我们需要去做用户洞察——也就是数据分析、画像分析能力

在做用户的分析洞察时,会持续的去构建特征。一开始我们不是按照这种分类、分层的方式去做,而是一二十个数据分析的同学画一个方向。

比如:这个APP,它行为和兴趣会按照垂直的方向去画,但这样会导致在算法使用的时候会比较乱,会不知道这个特征和其他的特征有没有关联性。在具体使用的时候,需要做一个筛选,但这个成本非常巨大。

那在后面分工上,让大家专注于我们主要的分类目,来进行一种分工,然后再分类目之下,再进行通用行业以及场景化个性化的一种处理。

2. 标签挖掘分享

大家可能会比较关注是——我们的标签会有多少?

会很多人说,我们有上万维的标签,打宽或泛化之后的话,是有十万维甚至是百万维。

其实,本身原始的标签库差不多也是有上万维,那打宽之后的话,也就只有万维——但并不是说这些标签、模型都可以直接拿去使用。

我们实有上万维的这种标签,在某一个行业、某一个具体的场景下面,可能就只用了800维900维——因为在实施的过程中,要去做的一些裁解。

那我们去刻画一个人,要刻画到什么样的程度,才能识别出他当前的人生状态?

比如:她是30岁的一个女性,已婚,从事的是金融行业,喜欢奢侈品、健身——那从这些维度是可以识别出来的,这是她的一个基础属性,但具体要落地到她是否会开通会员,其实还做不到。

那我们就会结合第一方APP上报的一些行为的数据,两方来进行融合,提供这种场景化个性化的这种特征。如果对数据有了解,就会知道数据在比较少的情况下,效果会比较差。

在这里,提供了三种方式的合作模式:

(1)提供一个线索包,然后进行打分

这种方式,会在线索包里做一个过滤,判断出来哪些用户值得去做精准化广告投放。因为广告投放平台,它的流量越来越贵。

假如有一个一百万的包,全部去投的话,成本是比较大的;如果这100万包里面,筛选出来30万,这30万是比较有价值的,然后也更容易转化。可能你投了30万,但达到的效果跟100万包差不多。

(2)线上新增的用户

比如:你一个用户来了你的APP之后,数据会比较少,会很难发现他的意向、意愿。在这个时候,常规的做法是让他沉寂一段时间,他这个APP用一段时间后,再去看他们有什么样兴趣、偏好。

那在这个过程中,数据要积累到一定的程度才能去刻画。可能需要两周、一个月甚至三个月,要看用户的操作频次,以及看他对我们内部哪些内幕感兴趣。

在这里就是把评估提前,只要用户来了之后,就可以根据他的这种设备相关的这种指纹信息以及它这种环境的信息,再加上我们已有的大盘的脱敏标签库,来进行一个评估,判断他是不是我们某一类的开通会员。

这种场景下的用户,是不是付费某一个产品、某一个商品的用户。做到这种程度,渠道质量的评估也可以纳入进来,在这里做一个提前的这种预估。

(3)用户的分群

去重点群体的挖掘(留存用户),要花费比较多的精力,我们要确定怎样去把这些用户进行盘活,哪些用户能带来营收上的增长?哪些用户可以带来分享或其他一些渠道带来的新的流量的增长?

但APP本身会因为数据孤岛的问题而变得很难。

我们结合大盘的一些特征和用户在APP上面的行为特征,去做一个精准化的刻画:

本来一个用户在过去到现在他已经买了某个商品,这时候我们已经获悉了他的特征,我们再用结果去反向预测当时的情况,就会出现问题。

所以,我们建立了回溯机制——就是说某一个客户他提供给我们的样本,假如说:今年3月份的4月份的,那我们只用这3月份4月份的特征去做模型的建设,再用它现在的特征去做预测,这样就可以达到模型上的可适用性。

我们也提到上万维的特征,在具体落地的时候,不知道哪些特征会有效。

在这时候,就需要先进行一些大量的相关性分析,让重要性的分析根据线索的人群去做。

在这里,会涉及到重复性的、大量的、人工的一些实践过程中的开销。如果我们的新客户提供的样本比较少的情况下,就算做了一个建模,把其他的特征做了很大程度的优化裁剪,它的每一个效果都不好。

我们一个比较大的一个样本,那它就会有比较好的一个点击数,它可以更深的刻画我们一个群体的特性。我们也会对客户的一些样本数提供一些要求,但其实很多这种APP,它是一个逐步从零一到1,再从1到100的过程,有很多数据是没有的,那么我们就是提供一些通用性的数据。

3. 案例介绍:网贷行业

这里分享一下网贷行业,大家会经常看到一些P2P的一些新闻——某个公司就倒闭了、某个创业合伙人跑路了。

其实根本原因是对风险的一个控制,对风险的一个承受能力。在这里其实也基于逾期行为的预测,去判断一个用户他是不是可能会逾期,甚至是不还。

大家会发现:在不同的行业上,有不同的诉求;不同的场景下,它是有不同的模型要求。那就需要一个一个行业的去探索相关场景化的一些标签、一些解决方案。

但对某一个行业,提供了相应的解决方案之后,这个方案是可以复制的。当然,这种复制,是把解决方案的能力进行复制,针对于不同的用户它的数据不一样,它的模型效果会有一些差异。

而且在网贷行业,我们会发现:同样的网贷场景的客户,他们提供的样本是不一样的,有些他们可以提供带钱的样本,没有经过任何风控、任何人工干预,就是自然的一种流量上的放款。这种的话效果会比较好,因为没有其他人工的干预。

那么还有一种是——贷后样本,它经过了其它的反风控的规则或者黑名单的过滤。那在这个过程中,它相对那种单纯模型而言效果会比较差,但是在实际使用上面的效果,不见得比上一种差。

4. 安全思考设计

我们会提到一个数据安全问题,我们提供给to B的用户to C的这种预测,那我们把我们的产品模型构建好之后,等着我们用户来接,然后客户他说:

“唉,我把我司数据给你之后,我的数据不安全。”

这种被动,应该怎样解决呢?

  1. 比如:我们的教育行业张三,他看了李老师数学的课程,这个课程,我们会进行数据的脱敏,让我们的B端客户觉得这个数据是比较安全的,但是客户不知道它的具体的一些信息是怎么做。
  2. 比如:数学的具体内容信息,对它进行数据脱敏,但不是把00001变成0002,这样是没用的。所以客户将张三标记成0001,但我们不知道这个标号是什么。对我们来说,我们只能拿到一部分行为的内容数据,但并不知道用户的隐私数据。

但其实可以减少很多不符合客户需求情况,就如:我们预测某一个用户,他是否会去开通会员。

四、精准触达

1. 信鸽移动推送

那在这里,介绍一个移动的推送信鸽,在我们内部,推送信鸽其实持续使用了很多年。像王者荣耀,我们持续保航,在五分钟内,可以向王者几千万用户推送过去,这是一个有相应性能的产品。

在这里,我没有强调画像的能力,我们可以去做一些精准触达,比如:我们APP有百万级用户,我们有很多这种群体,我们想把某一个运营信息单独的推荐给年轻、喜欢健身的女性,那我们可以做到这一点。

2. 更多精准触达

当然,数据产品,其实大家一般都会画图。

  • 第一层,是做地方的数据融合,加上内部的画像。
  • 赋能第二层的话,会进行标签的工具特征,然后进行相应的模型选择。模型的选择,需要去判断在线的分类模型,还要根据实际的特征,去用到CN或者RN这样的一些模型。

这其实就是一个服务落地,我们最根本的一个营销是——一个用户的分群,是以什么样的理念去分群。

最后就进行一个就是小步实验,简单来说可能是一个A/B test。在我们内部的话,会是实现一种分层的实业逻辑,再往上的话,我们的场景运用,是具体某一个行业的方向。

以上为嘉宾分享内容。

相关阅读

虽然很多人都被点名,但很少有人被选中|2018中国产品经理大会深圳站现场报道

 

本文为嘉宾现场分享整理内容,由人人都是产品经理@Ella 整理,编辑有调整

未经本站许可,禁止转载,谢谢合作

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!