阿里巴巴云上数据中台之道01

0 评论 1660 浏览 2 收藏 9 分钟

本文将带你深入了解阿里巴巴如何构建云上数据中台,分享其背后的大数据思想发展史和具体的实施策略,引导你探索如何利用数据驱动业务发展,希望对您在数据管理和应用方面的理解和实践有所帮助。

近日,疫情卷土重来,原本安排的旅游出行计划泡汤,所以还是老老实实在家看书吧,灵魂和身体总有一个要在路上,不是吗~

接下来我们来一起读读《大数据大创新:阿里巴巴云上数据中台之道》这本书,了解阿里建设数据中台的由来以及如何建设数据中台。

有迹可循的大数据思想萌芽,可追溯至1974年,当时便有学者撰写论文,研究如何用程序处理“大数据集”。

1991年,Bill Inmon出版了《建立数据仓库》一束,其中首次提到了数据仓库的定义——面向主题的、集成的、相对稳定的、反映历史变化的数据集合。

2003年,Google公开了内部海量数据处理技术——基于冗余存储机制的分布式文件系统GFS、用于搜索索引计算的并行处理框架MapReduce,这些促成了分布式系统基础架构Hadoop。

2011年,EMC世界大会以“云计算相遇大数据”为主题,正式提出“大数据”的概念,同年,麦肯锡全球研究院发布报告《大数据:创新、竞争和生产力的下一个新领域》。

2017年,根据CCW的研究,全球的大数据市场规模已达到2000亿美元。

而阿里在2012年开始探索在云上构建大数据体系,云上数据中台致力于构建“快、准、全、统、通”的智能大数据体系。其最终目标为催生数据智能化,促进业务发展与模式创新,数据价值变现乃至产业变革升级。

简而言之,就是我们最常听到的用数据来驱动业务发展。

当然说归说,那怎么用数据驱动业务发展的呢?那我们一起来看看中台大佬阿里是怎么做的吧~

阿里巴巴云上数据中台之道01

整个数据中台包含三个层面:统一计算后台、统一云上数据中台、赋能业务前台。

1. 计算中台

计算后台同时具有离线计算、实时计算、在线分析能力,从而让用户尽可能早并准确地看到历史数据。

2. 数据中台

通过智能数据能力实现全局数仓规划、数据规范定义、数据建模研发、数据连接萃取、数据运维监控等。这些能力需要如何构建的呢?

首先是数据采集,采集尽可能丰富的数据,包含业务数据、服务器日志数据、埋点数据、第三方数据等。

接着进行数据预处理,清晰、结构化采集所得的数据后,行程垂直数据中心,即统一的ODS数据基础层。

然后进行数据建模研发,并处理不因组织架构变动而轻易转移的数据中间层,包含DWD数据明细层和DWS汇总数据中间层,它们与ODS基础层一起行程公共数据中心。

最后增加数据标准,基于OneData规范构建指标体系,计算出复用性强的统计指标,将其增加到公共数据中心。

基于OneEntity规范构建标签体系、数据体系,将各个垂直的孤岛数据连接起来,并萃取不同于统计指标的精华数据,如行为标签、关系等,行程萃取数据中心,包括消费者数据体系、企业数据体系、商品数据体系和位置数据体系。

其最终形态可分为指标体系和标签/数据体系,通常指标体系以业务线的视角进行划分,如划分电商、金融2套指标体系;而标签/数据体系通常以某个实体对象视角进行划分,如划分消费者、商家数据体系。

3. 业务前台

阿里内部部门众多,受众有三大类,阿里小二、阿里客户、社会大众,他们基于同一数据体系,同一份可复用的数据。

阿里小二即内部工作人员,可以使用内部数据平台,进行业务数据化,包含全局数据监控、数据化运营、数据植入业务等,数据平台为其提供如下4个层次的服务。

第一层:数据工具服务

普通运营有查看或分析业务数据的需求,所以阿里数据平台提供了多种BI工具,如快门、小站、孔明灯等,供运营自助获取数据、多维分析、DIY个性化数据门户。目前具有综合性代表意义的是Quick BI。

第二层:专题分析服务

运营对类目分析具有强烈的诉求,平台按照分析师沉淀的成熟分析思路组织数据,帮助运营自助分析行业异动的原因,实现人人都是分析师的目标。代表产品有:

直播厅:辅助业务根据实时数据调整资源及分配流量

行业360:行业一体化分析产品,从行业视角提供360度数据披露及沉淀数据分析的思路

A+:流量分析产品,从流量视角积累并提供流量相关数据,包括对站点、页面、区块、位置浏览、曝光、点击分布数据,一级资源位活动投放数据等进行数据分析

第三层:应用与分析服务

日常营销活动中,需要选择商品和商家搭建专场活动,使用黄金策这类的数据产品,可以完成系统间数据的对接,通过设定条件筛选出目标数据,支持自助分析、调整条件,将调优后的结果直接对接到前台的应用系统,满足个性化推荐的需求

第四层:数据决策服务

高层管理者和决策者需要宏观的业务数据,可沉淀的数据和丰富的趋势来辅助决策,包括通过数据了解业务进展、判断当前进展是否合理,调整业务方向等。

阿里数据平台提供定制化的数据产品,如全景洞察、高管日报等,为高层管理者提供宏观决策分析服务,包括历史数据规律分析、未来发展趋势预测、全行业动态洞察等。

阿里客户即商家、内容创作者等,可以使用生意参谋。

但罗马非一天建成的,阿里庞大的数据体系也是在不同业务驱动下,经过4个阶段的建设,才不断完善起来。

那对于即将建设数据数据中台的企业而言,在缺乏经验的情况下,如何建设适合自己的数据中台服务呢?

接下来一章,草帽小子会继续分享阿里云上数据中台执行计划的文章,敬请关注吧~

专栏作家

草帽小子,公众号:一个数据人的自留地,人人都是产品经理专栏作家。《大数据实践之路:数据中台+数据分析+产品应用》书籍作者,专注用户画像领域。

本文原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!