标签分类的三种方式:按用途、按统计方式和按时效分类

1 评论 24423 浏览 85 收藏 15 分钟

编辑导语:标签体系是整个用户画像建设的基础,若没有建设好,对后面的调研及规划会有一定的影响,标签体系的分类能够给我们节省时间、提高效率。本文对标签体系进行简单的介绍,希望对你进行标签分类有帮助。

标签体系是整个用户画像建设的地基,不打好地基,摩天大楼就不可能平地而起。草帽小子在做调研及规划过程中,就深深认识到标签体系的重要性,接下来草帽小子会重点介绍标签体系。

一、标签分类

不同公司的标签分类有所不同,目前市面上有三种常用的标签分类方式:

  • 按用途分类,可分为基础信息、用户行为、业务偏好、场景标签;
  • 按统计方式分类,可分为事实类标签、规则类标签、预测类标签;
  • 按时效分类,可分为静态标签、动态标签。

1. 按用途分类

按用途分类的标签,可分为基础信息、用户行为、业务偏好、场景标签。通常面向产品/业务人员,分类时需要根据实际的业务需要进行类别划分,以便适配业务人员在通用场景和定制场景下标签的使用。

1) 基础信息

标签基础信息标签,是用于描述用户的基础属性,包含自然属性、社会属性、业务属性等,如性别、年龄、常驻城市、RFM、会员等级等标签。

① 年龄

人们在一生中购买不同的商品和服务,在幼年时吃婴儿食品,在发育时期和成年时期吃各类食物,在晚年吃特殊的低热量食品。人们对衣服、家居和娱乐等的喜好也跟年龄有关,这也就是为什么年龄是画像中常用的标签。

② 职业和收入水平

职业影响一个人的消费模式,如蓝领工人通常会买工作服,公司的董事长则会买名牌服装及高端产品。不同职业的人群收入水平不同,针对高收入水平的消费者,可向其推荐更优质的商品,促进商品转化率。

2) 用户行为标签

心理学家马洛斯认为,在某一特定时间,人们会受到特定需求的趋势。

他的理论是,人类的需求是按层次排列的,从最迫切的需求到最不迫切的需求。按重要程度排列,这五种需求分别是:生理需求、安全需求、社会需求、尊重需求和自我实现需求。

消费者总是先寻求满足最重要的需求,当最重要的需求得到满足之后,他就会寻求满足下一个最迫切的需求。

用户行为类标签,主要通过洞察用户在最近一段时间内的各类行为,如浏览、搜索、收藏、加购等,进一步提炼出用户的需求。

用户搜索或加购某一类型的商品频率越高,其消费需求就表现得愈加强烈。提炼出的常见标签包括近7天上网时段、近30天收藏品类、近30天消费频度等。运营者可通过组合圈选择有多种行为的用户,为其定向推送相关商品。

3) 业务偏好标签

业务偏好标签,用于描述用户的偏好业务内容,根据公司业务不同,划分不同的分类,通常电商行业业务偏好类标签包含运动户外、数码家电、食品保健等,其他行业的业务偏好标签根据实际业务而定。

一般情况下,以上这3类标签即可满足常用的标签使用需求,因为其已描述who(基础信息)do(用户行为)what(业务偏好)的整个过程,该用户的行为合集构成了整个用户画像。

但随着标签的使用,业务人员发现,经常会有些同类似的活动,使用到了类似的标签组合,类似的人群包。于是这类标签组合便可沉淀下来,针对特定场景使用。

4) 场景应用标签

场景应用标签,用于特定场景下使用,由业务使用经验积淀而来,例如618/双十一活动标签,双十一预付定金人群、双十一下单人群等。标签建设初期可不设置此分类。

2. 按统计方式分类

按统计方式分类的标签可分为事实类标签、规则类标签、预测类标签。与按用途分类不同的是,按统计方式分类的3类标签通常面向研发人员,意指标签是按何种方式计算而来,其复杂程度、产研成本由低至高。

1) 事实类标签

事实类标签是用户画像最基础、最常见的标签,通常是基于原始数据清理后的归类,用于描述客观事实。例如,姓名、会员等级、终端类型、购买次数、购买金额等。

2) 规则类标签

规则类标签,顾名思义,是基于确定的规则而产生。与事实类标签不同的是,规则类标签拥有更多的业务属性,其业务规则需与业务人员共同制定。例如,将“活跃用户”标签可定义为,“过去30天发生a行为x次”&“过去30天发生b行为x次”,进行综合评定。

① 用户活跃度标签

实际业务场景中会涉及根据用户的活跃情况,给用户贴上高活跃、中活跃、低活跃、流失等标签。那这个过程中高中低活跃度对应的时间范围是如何划分的呢?

在这里,靠拍脑门可行不通,标签讲究定义有依据、建设有方法。

首先划分用户的流失周期,运用拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。

比如图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点。

我们可以用5周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续5周都没有访问/登录,则定义该用户流失。划分完流失周期之后,初期可根据根据四分位数,将用户的活跃情况划分为高中低,后期根据数据情况更新规则。

② 四分位数

也称为四分位点,是指在统计学中把所有数值从小到大排列并分为四等分,处于三个分割点位置的数值。

如历史数据,选择近1个月访问APP次数在0-8之间,则取3/4分位点为6、1/4分位点为2。

  • 高活跃用户:近1个月访问APP次数在[6,8]区间的用户
  • 中活跃用户:近1个月访问APP次数在[2,6]区间的用户
  • 低活跃用户:近1个月访问APP次数在[0,2]区间的用户

③ RFM标签

根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费时间、消费频率、消费金额。

  • 最近一次消费(Recency):指用户上一次购买的的时间,一般上一次消费时间越近的顾客是质量更佳的顾客。最近一次消费是维系顾客关系的一个重要指标。
  • 消费频率(Frequency):顾客在限定时间周期内消费的次数。消费频率高的顾客,也是满意度最高的顾客。根据这个指标,可以把客户分成几等份,相当于划分了一个忠诚度的阶梯。
  • 消费金额(Monetary):消费金额时产能最直接的衡量指标,也可以验证“二八定律”,公司80%的收入来自于20%的顾客。

我们在设计RFM标签时,可根据二八定律来进行标签分级。

④ 二八定律

二八定律又名80/20定律、帕累托法则,它是在19世纪末由意大利经济学家帕累托发现的。

帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。给一个公司带来80%利润的是20%的客户,按照这个原则,如果能把这20%的客户找出来,提供更好的服务,这对于公司的发展和业绩增长起到至关重要的作用。

  • R:如历史数据中80%的用户最近访问<90日为“近”,用户最近访问>=90日为“远”。
  • F:如历史交易订单量80%的用户订单量<10单为“低频”,订单量>=10单为“高频”。
  • M:如历史交易订单金额80%的用户交易金额<2000元为“低额”,交易金额>=2000元的为“高额”。

客户类型可划分为:

  • 重要价值客户:R↑ F↑ M↑,消费金额、消费频次大且最近有消费的用户,则为优质客户;可倾斜更多资源、提供VIP服务、专属客服通道、个性化服务
  • 重要保持客户:R↓ F↑ M↑,消费金额和消费频次大,但最近无消费,需要唤回;可提供有用资源,通过续订或更新产品赢回他们
  • 重要发展客户:R↑ F↓ M↑,消费金额大,且最近有交易,但消费频次不高,需要重点识别;可交叉销售,提供会员/忠诚计划,推荐其他产品
  • 重要挽留客户:R↓ F↓ M↑,消费金额大,但消费频次不高且最近吴晓飞,此为最潜在有价值的客户,需要挽留;可采取push消息触达,回访等措施,来提高留存率
  • 一般价值客户:R↑ F↑ M↓,消费频次高且最近有消费,但消费金额较小;需要进一步挖掘,向上销售更高价值的产品
  • 一般保持客户:R↓ F↑ M↓,消费频次高,但最近无消费且消费金额较小;可向上销售更高价值的产品
  • 一般发展客户:R↑ F↓ M↓,最近有消费,但消费频次及金额较小;可按消费类型推荐其感兴趣的产品
  • 一般挽留客户:R↓ F↓ M↓,无消费的新用户;可开展活动,免费试用,提高客户兴趣,建立品牌认知度

3) 预测类标签

预测类标签,基于现有事实及规则无法得出,需要运用决策树算法、贝叶斯算法等进行数据挖掘与训练,得出标签预测结果。

预测类标签复杂度高、开发周期长、开发成本高,且需要算法工程师参与,通常此类标签的占比较少。

3. 按时效分类

按时效分类,可分为静态标签、动态标签,方便业务人员在需求提出时做好时间维度的限制,同时方便开发人员在标签更新时,设置静态标签的更新时间更长,提升数据产出效率。

1)静态标签

静态标签通常用于描述固有属性,不随时间的变化而改变,如性别、身高、体重等。

2)动态标签

动态标签需要动态更新,来保持标签的有效性,如近7天购买次数、近30天加购次数等。

二、标签分级

随着标签的增多,当标签数量发展到成百上千量级时,业务方要从中找一个标签就会十分困难。所以标签在建设初期就需要进行分级分类的管理,就像整理电脑文件夹一般,分类清晰的标签更便于查询使用。

标签常用的分级结构为:一级标签、二级标签、三级标签、四级……逐级往下分。

注意:建设初期要注意的是层级不必生搬硬套、划分过细,根据标签建设实际情况划分即可。如果公司只有几十个标签,则划分至二级足矣,过细反而累赘。

 

草帽小子,数据产品经理一枚;用户画像、埋点、指标体系、BI、广告投放等系列作者;《大数据实践之路:数据中台+数据分析+产品应用》作者;“数据人创作组联盟”成员。

本文由@一个数据人的自留地 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 很实用

    来自上海 回复