如何理解主题域?

0 评论 1084 浏览 0 收藏 4 分钟

我们可以将主题域看作多个主题的合集。那么,为什么要划分主题域?主题域和数仓分层又有什么关系?这篇文章里,作者尝试进行了解答,一起来看。

前面介绍了数仓为啥要分层?那为啥要划分主题域?这俩有啥区别?

一、啥是主题域?

啥是主题?

回想我们小时候学习语文做的题目“总结这篇文章的中心思想”、“以‘梦想’为主题去写一篇作文”;去参加论坛,一般都可以从论坛海报上了解此次论坛的主题;去看展览,我们也能早早知道展览的主题是什么。

所以在文学作品中主题是作者所表达的中心意思,它渗透、贯穿于文章的全部内容。主题在不同的领域中也有着不同的定义和解释,在数据领域中,主题是从较高层次,根据对业务的宏观认知或使用习惯抽象出的能表达某类相同含义的数据合集。

主题域就是多个主题的合集。

二、为啥要划分主题域?

在数仓中,对数据进行了分层处理,合理的存储了一堆数据,但数据最终是要拿出去用的,要面向业务的。

此时用户是业务人员,核心动作是找数据。

如果没有主题划分,面对海量数据,应该怎么查找呢,通过表名?记不住,也理解不了。就像你的衣服一样,以面料,加工工艺来区分衣服,那记得头发都要掉光了。

既然是给业务人员使用,那么就应该以业务能够理解的方式去组织和划分数据,业务过程就成了主题划分的依据。就比如服饰可以划分为春装,秋装,帽子,首饰等,然后分类存放,这样才比较好找,不至于找不到还翻得乱七八糟。

三、与分层有啥关系?

数仓分层是从存储,从管理角度对数据进行组织,是纵向空间上的划分。

主题域划分是从使用,从业务的角度对数据进行组织,是横向业务上的划分。

大概就是魔方的那种感觉吧。

四、如何划分主题域?

主题域的划分没有特定的方法论。可以是客观的,也可以是主观的。

  • 按照业务过程划分:划分主题域的前提,先理清业务过程,根据业务过程去抽象出主题,比如浏览,曝光,点击,都属于用户行为的业务过程,就可以抽象成流量主题。
  • 按照部门划分:比如传统企业的人资、财务、物资、项目等主题。

看看同行是怎么划分的:搜索一下同行划分的主题域,结合公司实际的业务情况,取其精华去其糟粕。

总之:主题域划分的目的是快速找到数据,所以主题域划分的重点是和最终用户去商讨确定,看看什么样的划分结构用户更容易理解,并用发展的眼光去看待主题域的建设。

本文由 @清小墨 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!