指标管理必知的真相:订单事实表里没有原子指标

0 评论 1474 浏览 4 收藏 11 分钟

原子指标在工作业务中会用上,对于原子指标内容,大家对它理解多少呢?下面这篇文章是笔者整理分享的关于指标管理中原子指标的相关内容,大家一起来看看吧!

上篇文章「一个问题鉴定指标管理真实力:订单表里有原子指标吗?」写完以后,分享到一个群里,有同行回复:有,比如订单金额。

看到回复,我脑子突然就断电了,好像对诶!确实是有原子指标叫订单金额的。果然,哪怕推导过依然会经常忘记,我当时是咋推导出来的呢?跟我一起来看看~

一、先看一些材料

阿里的数据团队基于电商的海量大数据,在国内构建顶级的数据系统,也输出了很多数据理论和规范,他们产出OneData指标理论体系,也可以说是业界公认的标准体系了。以下两段内容以及图片都来源于阿里云dataworks-智能建模/原子指标

指标是衡量业务特征的统计数值,用于体现企业某一业务活动的业务状况。指标通常分为原子指标和派生指标,与指标相关的参数还包括修饰词和时间周期。派生指标则是由原子指标 + 时间周期 + 一个或多个修饰词组成。

原子指标用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务过程)创建的,用于统计业务活动中某一业务状况的数值。例如,用户的业务活动为购买,则原子指标就可以指定为支付金额。

下面这张非常经典的图估计你也看过,也是来源于阿里数据团队的书:《阿里巴巴·大数据实践之路》,被很多数据领域的文章和书籍所引用。

第一次看这张图,我很震撼。因为当时对指标体系的认知很模糊,相当于给我当时错乱的脑子梳理出来一个非常清晰的逻辑。

但其实,有一些东西深究下去,发现自己不理解。比如,维度为什么指向属性?是维度表里属性字段的意义吗?那什么是度量,度量和指标是一个意思吗?数据域是什么?如何划分?划分的标准是什么?

但后来,我发现很多书、文章都是基于这套理论系统来展开的,有的甚至把原子指标、派生指标这套体系大讲特讲,但始终没把蠢蠢的我讲懂、讲服。

其实,这些问题萦绕在脑子里,需要结合实际数据慢慢去去理解,甚至是需要自己依照这个图的结果自行给出合理的解释,才能说服自己(就这样吧,别纠结了吧)。好吧,但既然大家都这么说,那我也就随大流吧。但始终我还是觉得没懂,不太舒服,直到我捋清楚了。

二、为啥没有原子指标

接下来,我说说为啥订单事实表里没有原子指标。以下,我们结合数据仓库的知识一起来看几个点(包含我的个人理解)。

第一,指标定义。指标是对事实的数字化度量。

第二,原子指标特点。原子指标是最细粒度、不可拆分的指标。

第三,派生指标的定义。派生指标 = 一个或多个修饰词 + 时间周期 + 原子指标(有的公司也叫衍生指标,不管叫啥定义都差不多,有的公司定义是这样:衍生指标 = 维度+时间周期+业务限定+原子指标)。

第四,事实表的特点。事实表,包含维度属性字段和事实字段。如果有疑问,可以看《数据仓库工具箱·维度建模权威指南》里对事实表的定义。也可以看各个数据产品中数据建模的功能模块,在创建事实表时,字段会分不同的类型,维度 or 指标 or 事实。

可以参考官方文档:华为云数据治理中心 DataArts Studio> 用户指南> 数据架构组件> 模型设计> 维度建模> 新建事实表。

也可以参考:有数数据开发及管理平台用户手册 V6.5.0 Update /离线用户手册/模型设计中心使用指南/外部数据源建表演示。

当然,你依然可以参考:大数据开发治理平台 DataWorks 操作指南/数据建模 DataWorks智能数据建模/维度建模/可视化建模/创建逻辑模型:明细表

不过需要补充说明,阿里的dataworks这款产品里,维度和粒度很容易把人绕晕(关联粒度,也就是关联维度)。

有了这四个前提,很明显看到:订单事实表得有维度,而原子指标没有维度。故而,订单事实表没有原子指标。

那表里面有啥指标呢?表里有数,所有的数对应的都是衍生指标,或者派生指标(或者复合指标),都是具有非常明确业务含义的指标。正如这篇「文章衬衫的价格是九磅十五便士,那么你应该选…」提到的:一个美丽小胖黑孩(皮肤黝黑),买了一个中国的纯棉衬衫,衬衫的价格是九磅十五便士。

单纯说「订单价格」这个指标,是没有任何业务含义的,在具体的业务场景里的解释一个具体的数字才有实际意义。就好像,平台打广告给咱们说:诶呀,双十一衬衫跳水价啦!但是呢,你喜欢的特定品牌的、M码的、黑色经典款的衬衫价格没降,结果你没下单,系统也没订单生成。

就算咱们把这个订单金额的指标定义出来了,有啥真实意义呢?没数哇,分析啥?要解释啥?啥也没有,洗洗睡了。聊抽象的东西,可以聊,但是分析一个真实发生了的、一个具体的什么样的人、买了一件具体的什么样的衬衫价格多少,才有意义。

三、不争了,而且我知道你懂,请让我再说一句

到这里,问题的争论就结束了,咱也不掰扯概念了。不管认不认可答案,只要知道:衍生/派生指标由修饰词/维度/时间周期/原子指标组成,你肯定也知道指标该怎么管。原子指标,只不过定义了数该怎么算,从哪算。

除了原子指标以外,其他构成派生指标的其他元素,是叫做修饰词、维度、业务限定,都无所谓了。

再多的前缀,也都是修饰,形容词。「原子」这个词语在我们中文语义里,是不能再细拆的,而当我们加形容词,描述的粒度反而越来越细,这个结果跟对词语的理解是完全相反的,很容易给人带来错误的感觉。

任何的形容词,都是对原子指标的细致解释。最终,我们反过来看。与其叫做原子指标,不如换种说法叫词根指标。比如:近1天线上渠道订单金额、近1天线上渠道会员订单金额、近1天上午时段线上渠道高级会员订单金额。

当我们彻底搞明白了指标的定义,有了自己的理解,哪怕真实的工作中业务复杂,有成千上万的指标,我们也不会怕了,一眼就能识别出来。希望看完文章的你,不用再为概念纠结了,也不会被别人轻易地唬住了,也能一眼识别对方是在不懂装懂,还是真的OneData大师~

-end-

接下来,我们可以看看指标具体怎么管,指标管理系统如何构建,会碰到哪些问题,而这,是一个复杂的系统性工程。以上~感兴趣的话,记得点赞、收藏,如果还有问题,记得留言喔,这样我才有继续写的热情,我们下回见!

-推荐阅读-

一文帮你更好地理解指标

四千字全面解析数据产品经理必知概念:标签、维度、指标

专栏作家

Lee,公众号:数据产品小lee,人人都是产品经理专栏作家。关注直播、短视频和文娱领域、擅长数据架构、CDP及数据治理相关工作。

本文原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!