数据的来源以及数据是什么?

5 评论 9788 浏览 5 收藏 7 分钟

编辑导语:随着大数据时代的不断升级,数据在我们的生活工作中显得尤为重要,其实在很早之前人类就用数据来进行记录,随着社会的发展,网络时代更需要数据的记录以及支撑;本文作者分享了关于数据到底是什么的分析,我们一起来了解一下。

01 远古时代的数据

「数据」本身是存在的,就像空气,只有出现雾霾使它显式地呈现在我们脑海里。在百万年前,推及上亿年前,在人类没有出现在这个蓝色星球之时,数据这个事物一直在那里,它等待着的是人类那灵光乍现的智慧赋予它正真的含义。

在没有计算这个高端的家伙之前,人们为了让「数据」更加具象,便于统计,进行了至今数万的探索。在身边坚硬的物体如石器、骨片以及树干为载体,刻下纹理来代表对现实事物的表达,似乎成为了一个理所当然的开始。

1960年在非洲乌干达与扎伊尔交界处的伊尚戈渔村发掘的一根记数刻骨“Ishango Bone”(伊尚戈骨头),这是距今一万前伊尚戈人新石器时代早期的作品,是最早的刻符记数实物。远古部落人民使用这些凹痕记录日常的交易活动、物资储备和大事小情,并用他们来进行基本的算术计算。

伊尚戈骨头

02 现代化的数据

在今日计算机普及的社会里,数据更是显得非常有存在感,身处于大数据时代的我们已然意识到数据的重要性。那么什么是数据呢?看起来简单的问题,往往是最复杂的。

当下对数据更普遍的定义往往是从计算机原住民的视角。我们对客观事物进行观察、度量、猜测,按照统一或者不统一的尺度标准将结果予以记录,这些记录或多或少,都是数据。这些数据期望是未经加工的,它们能非常良好地代表原始事物本来的面貌和形态。

国际数据管理协会(DAMA)也认为,数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现。也就是说,数据要表现事实,受限于数据的采集技术以及数据解读能力,这或许这是一种理想。

数据表征存在,存在是不以人的意志为转移,包括物质的和精神的。物质方面有大自然中的风、雨、雷、电、人和动物等实体,这些是有明确感知的,非常方便数据化。在精神方面,人的欢乐、哀怨等情绪可以被大量多次主观度量,最终也可以形成数据。

数据似乎往往应用于实体,实体是大多数据刻画的对象。在刻画实体时往往需要系统数据,单一的数据似乎不那么受欢迎。在拥有了大量的对一个实体的刻画数据后,经常会从量变发生质变。

集结数据成为「信息」,加工信息成为「知识」,运用知识产生「智慧」,数据成为低层的驱动者;它们之间环环相扣、循序渐进,构成了「DIKW 金字塔」。

数据-信息-知识转化模型

我们再来看看东方智慧。中文词语「数据」暂且不论其词源,容我们从字面窥探一二。

「数」有两层含义,一个是数据往往用数字来记录事实,如一个人的年龄,一座山的高度;另个一个层面是它用数学的方法来进行统计最终得到记录结果,如一群人的平均年龄和群峰的平均高度,都应用了数学中的平均数概念。

再看「据」,我将据理解为日常生活中的票据,票据是证明,证明发生过此事,是人类大脑缺点的补充,是对时间的凝固,因此「据」是事实。所谓数据就是事实的数字化凭据。

03 展望未来

正如开头所讲的一样,对于数字时代的我们,数据或许真的和空气一样,已经不需要我们再去思考其概念。

当我们每天生活有数字化加持的小区里,工作在繁华的智能办公商业区,享受着数字生活的便利时,这一切显得是那么自然,而这也正是物联网时代下新的数据生态。

物联网时代下的数据

更多的思考,是为了更好地出发。在对数据概念的理解上我们还需要继续探索,欢迎各位数据人在评论区留言,谈一谈你认为的数据是什么。

 

作者:李庆辉(新芭)数据产品专家,数据产品团队负责人;擅长数据治理、数据分析、数据化运营;Python书籍《深入浅出Pandas》作者;

本文由@一个数据人的自留地 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 五官六感所能得都是数;
    五官六感所不能得(细胞、病毒等)也是数;
    所得的东西,经过证实记录(写成文,绘成画等)都是据

    来自贵州 回复
  2. 五官所能得都是数;
    五官所不能得也是数(细胞、病毒)等也是数;
    所得的东西,经过证实记录(写成文,绘成画等)都是据

    来自贵州 回复
  3. 我可以复制文本转载文章嘛,楼主

    来自贵州 回复
  4. 好文章,感谢

    来自贵州 回复
  5. 辛苦

    回复