数据可视化如何选择数据指标

0 评论 7915 浏览 16 收藏 18 分钟

编辑导语:数据可视化在一定程度上可以更好地传递信息、监测数据,进而推动问题更快地被发现和解决。而合适的数据指标选择有助于更好地构建数据可视化体系,规避潜在风险。本篇文章里,作者对数据可视化如何选择正确数据指标做了相应分析,让我们来看一下。

一、故事引出的问题

橙歪瓜是电商公司负责某条业务线的产品负责人,每天都会通过数据可视化屏幕观察业务线的数据变化,近期发现订单量有较高的上升趋势,好像有些异常,询问后运营后,得知这些天有运营活动。想来是运营活动导致的订单量和GMV激增,橙歪瓜也没有太在意,没想到几天后,出事了!

公司新来的一个运营同事在新的活动中进行100元无门槛优惠券的配置,由于错误配置,所有用户可以无限制领取,且优惠券全场通用。黑灰产及羊毛党利用该“漏洞”领取大量优惠券,完成了千万的套利,导致公司在2天之内损失惨重。

可怜的橙歪瓜,谁能想到看似一个运营活动导致的订单量增加,却是一个重大的问题呢?

1. 订单量的激增为什么无法被感知是一个问题

橙歪瓜每天都通过可视化屏幕,进行日常的业务监测。

通过GMV(交易总额)、日订单量,我们可以明显地感觉到业务处于一个飞速的增长。

这是一个好的信号,通常来说,运营活动导致订单量激增,很多时候依然处于大家印象的“正常”范畴。

一方面因为新的运营活动必然做出了一些有利的促销活动,好像也能为订单量的激增做出解释;另一方面单从可视化屏幕进行观察,订单量、GMV的突兀增长变化也不能直接反映出优惠券被无限领取和大量使用的问题,所以每天通过可视化屏幕观察数据的小小橙也没能察觉到这是个问题。

事实上,数据可视化没能为用户做好预警,是因为订单量和GMV这2个数据指标无法明确传达业务异常的含义,如果在可视化屏幕中,新增一项图表,用来展示优惠券业务的数据情况:假设某电商平台使用优惠券的订单在全部订单中的正常占比是2%~10%,优惠金额在总订单金额的正常占比是在2%-6%,这是一个正常的区间。

当单日订单中,使用优惠券的订单超过10%,且订单优惠金额占比超过6%,这就已经很明确地反映出优惠券的业务出现异常了,橙歪瓜也能很清晰地就能感知到这个问题。

然而这些“关键信息”的缺失,导致用户未能及时发现风险;如果我们希望数据可视化能够更好地为用户提供分析决策的依据,第一步则是找到这些“关键信息”。

2. 什么样的信息是关键的

传递的信息真正是用户最初想要的,能够依据此信息分析出他想要的结论,那么这个信息就是关键的。所以可以看出,信息是否关键,取决于与用户目的的契合程度。

因此,要想确定关键信息,找到关键的数据指标,第一步,是确认用户的目的。

二、确认用户目的——择取关键指标

1. 结合应用场景感知用户目的

回到数据可视化的应用场景,数据可视化常被应用在2种场景。

  1. 数据可视化屏幕常见于展厅或公司前台,当投资人或合作客户来访时,首要看到的就是公司当前阶段全局的业务发展数据,各条业务线的关键数据指标展示可以让他们对公司当前的发展情况一目了然,体现企业实力的同时也为接下来的交流隐性的增加双方的合作机会。
  2. 数据可视化屏幕常见于实时监控中心/内部数据平台,不同于展厅那种向外界呈现全局数据的应用场景,监控中心/数据平台的面向对象通常是各个业务线的负责人,他们更关注自己业务线的细节信息。

如今一些互联网公司,产研团队和运营团队是分离的,产研不在公司产品运营城市的当地,因为不在一线,业务负责人/产品人员很多时候难以了解到线上运营的一些实际情况,往往只能通过用户主动反馈,有时候才能发现业务当中存在的一些问题。

然而被动地等待用户去主动的反馈是有极大的风险的,问题发现得越晚,给业务层面带来的损失可能就越大

而数据进行可视化表达后,管理人员可以直接通过相关数据观测,实时了解到业务的发展情况或异常问题,进而及时做出策略调整来抓住业务增量的机会或降低异常造成的损失。

假设某网约车平台中隐藏着这么一个问题:高峰期大量叫车的订单在3分钟内会被乘客主动取消,造成司机空驶一段距离后被突然取消,浪费司机运力。司机自己即使知道被取消订单的缘由,但不主动向平台反馈,业务负责人/产品经理也是很难发现这个问题的。

但借助数据可视化,业务负责人无需外界反馈,观测订单转化漏斗图(下单——订单被取消转化率)、乘客取消原因占比,即可发现到大量叫到车的订单被乘客主动取消的这个问题。

而越早发现问题,业务负责人也就可以更早地定位问题点,实际经过分析后发现很多乘客取消订单,是因为派单的司机距离自己较远(接驾距离超过5公里),此时业务负责人则可以及时地调整派单策略中的派单距离上限,来缓解这个问题。

结合可视化的应用场景了解用户对目的后,之后我们选择关键的数据指标,就有了选择的依据。

2. 基于业务目标思考可用数据

选择关键的数据指标的前提是,我们清晰地了解当前有哪些数据可供我们选择,所以此前我们需要整理出现有可用的相关数据指标。

业务目标是我们自始而终的驱动力,基于业务目标出发,我们将业务策略、业务度量贯穿,自上而下地思考现有可用的数据指标。

  1. 业务策略:我们为了达成业务目标采用了哪些方案;
  2. 业务度量:在实施这些方案的过程中,有哪些指标可以直接或间接衡量方案实施的效果。

以网约车为例,它相关的数据指标如何自上而下思考呢?

1)首先明确平台的业务目标:网页车平台希望满足用户能够便捷、快速打到车,安全到达目的地的诉求。

2)基于业务目标,思考平台采用了哪些业务策略,拿东风出行举例。

  • 便捷方面,东风出行提供了独立APP版本(包括针对老年人使用的敬老版APP)、H5打车、在滴滴上也能叫到东风出行的车;起始点自动定位,最优行驶路线选择等;
  • 快速方面,针对不同人群不同诉求提供了多品类产品选择,例如快车、专车、出租车、顺风车等业务,根据早晚高峰提高热点区域运力(司机端热力图驱动司机主动前往高峰区域),减少用户排队时间;
  • 安全方面,运营侧建立司机合规准入机制,APP端建立安全中心,为司乘提供实时位置保护,紧急联系人,行程录音,一键报警等措施。

3)业务度量:针对这些方案去思考有哪些指标可以衡量方案实施的效果。

  • 便捷方面:渠道订单完成转化率(APP/H5/第三方,例如从滴滴上叫东风出行的车),渠道发单数;
  • 快速方面:完单率、司乘供需比、高峰期排队乘客数、乘客排队时长、乘客取消率、司机取消数等;
  • 安全方面:…..

当然,在穷举出相关数据后,我们可能会发现大量的数据指标,例如滴滴出行2020年官方技术团队披露当下已有5000+数据指标进入到数据仓库,单凭用户目的,选择数据指标并不容易,因此我们还需要对数据指标分层级之后,在进行指标选取。

3. 指标分级辅助数据选取

指标分级主要是对指标内容的纵向思考,根据企业战略目标、业务线或事业群目标进行自上而下的指标分级,核心就是对顶层指标进行层层拆解,在拆解的过程中,指标逐步分为三层T1、T2、T3,子级指标通常能够体现出父级指标变化的原因。

1)T1指标——公司战略层面指标

用于衡量公司整体目标达成情况的指标,主要是决策类指标。T1指标使用通常服务于公司战略决策层(最高层领导),通俗点说T1指标可能就是公司最高层每年决定要达成的那几个目标点。

2)T2指标——业务策略层面指标

为达成T1指标的目标,公司会对目标拆解到业务线或事业群,并有针对性做出一系列运营策略,T2指标通常反映的是策略结果,同时也是业务线或事业群的核心指标。T2指标是T1指标的纵向的路径拆解,便于T1指标的问题定位,T2指标使用通常服务业务线或事业群。

3)T3指标——业务执行层面指标

T3指标是对T2指标的路径拆解,用于定位T2指标的问题。T3指标通常也是业务过程中最多的指标。T3指标的使用通常可以指导一线运营或分析人员开展工作,可以快速引导一线人员做出相应的动作。

以网约车风控领域的“逃单率”进行指标分级举例:

在网约车风控领域的初期阶段,“逃单率”作为领导层非常关注的战略指标,它与完单数一样直接影响着公司的营收,大量乘客坐车不付款逃单的行为可以致使公司每个月损失超过50万元(平台会给未支付的订单进行金额垫付给司机)。

虽然正常乘客为了后续能继续打车会进行订单支付,但黑产则可以通过批量注册虚拟号码产生大量的逃单行为,这对平台的正常运营造成了极大的干扰。作为高层领导,“逃单率”是其首要关注的几个指标之一,它完全归属于T1级指标。

而“逃单率”经过公式拆解:逃单率 = 未支付订单数 ÷ 完单数,我们可以发现“未支付订单数”直接影响了逃单率的升降。我们此时将其抽离出来作为网约车风控业务线的核心指标,也就是T2级指标,它引领整个网约车风控部门转动。

经过第一轮的指标拆解后,此时战略层面如何降低逃单率的问题到风控部门就细化成了如何降低未支付订单数。

而基于车型的维度分析,发现快车车型的未支付订单数在整个未支付订单数中几乎占据99.9%;而专车车型则几乎不存在未支付订单,此时“快车车型未支付订单数”成为了更加具体的T2级指标。虽然问题好像更加明确了,但此时风控部门依然无法确定降低“快车车型未支付订单数”的具体方案,因为批量出现未支付订单的原因还不明确,而解决问题的前提是,找到问题原因。

T3指标是基于各个业务场景提炼出来的验证性指标,它是我们对T2指标在各个业务环节的原因假设。通过T3指标,我们可以验证自身对于问题的原因猜想是否正确,以及问题最终的解决情况如何。

假设影响“快车未支付订单数”过高的问题点是注册登录阶段存在批量虚假号码注册、单个终端频繁切换账号下单的风险行为,那么我们从用户维度,人维度设立T3级指标进行假设验证。

用户维度

  • 未支付订单中的用户人均注册时长——区分未支付用户群是近7天内注册的新用户还是注册时间较长的老用户;
  • 未支付订单中的用户(高/中/低/正常)风险手机号个数——统计各风险号码(虚假号码)在整个平台中的占比情况,甚至进一步分析每个风险级别(高/中/低)用户在未支付订单用户中的占比情况;
  • ……

人维度(基于设备/IP等方向)

  • 每日下单设备数/每日下单用户账号数——分析是否多账号频繁切换设备,对应集中性下单的欺诈性特征;
  • 同设备关联用户数——分析未支付订单用户是否存在同设备关联的欺诈性特征;
  • ……

这些可视化的数据指标,可以直接明了地帮助我们验证自己对T2指标过高的原因猜想,一旦数据的反馈符合自有假设,业务部门可以迅速针对问题点提出详细明确的方案去执行。

这样最顶层模糊的问题“如何降低逃单率”就变细化成了可执行的方案“如何降低虚假号码,预防单个终端多账号下单等等”,随后通过观测各层级指标我们也可以明确的验证自己提出方案的效果 。

指标分级的核心是对于问题的层层拆解,拆解出来的指标可以明确对应到各个层级,有效地指引团队进行决策,当我们对指标进行分级归类之后,我们对于数据指标的择取就更加清晰明了。

最后再结合用户目的,我们就可以很轻松地完成关键指标的选取。

三、行文总结

数据可视化的本质是基于数据向用户传达有效信息,帮助用户做出有效的决策,所以确定关键的数据信息永远是第一步。

抛开个人经验,这个世界上,大部分人能想到的,取决于他获取到的信息。

参考文章:滴滴大数据仓库指标体系建设。

 

作者:橙言,前出行领域产品经理,现互联网金融风控策略产品;公众号:橙言

本文由 @橙言 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于CC0协议

给作者打赏,鼓励TA抓紧创作!
更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!