从数据角度,逆向认知互联网

数据分析如何避免沦为形式?15天在线学习get一套可落地的数据分析方法,了解一下 >>

对于刚入门互联网行业的人来说,掌握一些互联网基本常理、常识很重要。因此本文特地梳理了一些相关信息,以供了解与思考。

相信很多同学都对互联网拥有着极大的向往和热情,在跨入这个行业门槛之前,我们希望基于我们目前的认知水平,能和大家一起探讨最为基础一些理解及原理,并希望在您入行以后的工作和成长中,这些基础性的认知,对您快速看清现象背后的本质能有所帮助。

本系列只聊一些基础和本性的东西,只针对入门级别的同学,目的是避免踩坑,不会讲到具体产品案例、方法或者工具,高手请飘过。

本系列聊的都是一些基础的原理、常识和思考,其中原理是最为重要的,能像打通任督二脉一样,没准会让您觉得通畅。

一、网络的作用:加速

首先要了解人类从古到今,其实也就干两个事儿,第一是交流,第二是交换。交换是人类根本的目的,要实现这个目的,首先需要先进行交流。

互联网也一样,也只干这两个事儿:交流和交换。但是互联网是跨空间的,跨空间的好处就是节约了时间,所以互联网能改变的只是交换的速度,但不能改变交换的规则。比如你让商家100元进的东西,50元卖给你,让他喝西北风是不可能的。所以互联网的核心是满足了人类对交换加速的需求,而这个加速的主要表现就是用网络的空间换取了现实的时间。

了解了交流到交换这个基础原理,你将会对互联网有更简洁的理解,我们来看看做这两个事儿的都有谁啊?

做交流腾讯呗,做交换淘宝呗。瞬间你就知道了,哦原来如此。

再看看百度呢,你交换的东西你总得找找吧,找到后你问清楚后才能买吧,所以百度就是为了寻找交换对象的。

做交流的腾讯多想搞定交换啊,可惜拍拍不争气;做交换的多想扩展到交流啊,马云砸了钉钉那么多钱,也还在努力。

既然互联网的核心功能说清楚了,那我们谈论一个互联网产品的优劣,就有一个核心的标准——时间。

为什么呢?

因为互联网只起这一个作用,用空间换取时间,注意只是加速,没有网络,人类照样会通过原始的方式进行进行交换。但进入网络后,空间距离没了,交流的速度加快了,这样引起交换的速度也随之加快,所以是加快了速度,就成了互联网产品最主要的要求。

了解这个原理后,对于市面上所有的互联网产品,你就会明白为什么APP要突出单一按钮;为什么要淘宝要拼命推荐猜你喜欢;为什么要UI只取2个色系;为什么消息要即时推送,等等太多了。

因为产品经理使用的所有设计方法,几乎都在试图达到同一个目的,就是加速,也就是已经提过的用空间换时间。

怎么理解这个空间换时间呢?就像电商一样,没有电商,你一样可以买,但由于空间受限,你不可能为了件衣服去坐趟飞机吧,电商就很爽了,再远即使是跨国也能网购吧。

为什么一直强调这些基础的东西呢?那是任何行业都要首先了解原理,工业必须遵循牛顿力学,通讯业必须遵循电磁理论,建筑行业必须要抵抗地心引力,GPS必须依赖广义相对论公式等,因为只有遵循不变的准则,才能设计万变的产品和方案。

以上倒腾这么多,就是要请大家理解互联网最根本作用是啥,这是所有互联网产品必须遵循的天规,说抽象点叫空间换时间,说直白点也就是快一点。带着这个基本常识进入本行业后,将避免您踏入很多不必要的坑,也将提升您对互联网产品有更本质和基础的理解。

二、数据的表达:万物

前面已经讲到,人类的目的就是交换,而交换的东西则涉及到万物;而对万物的表达,就是数据(注意没有互联网,人们也一样的用数据表达万物,但互联网传播更快)。

那么在互联网上流动的数据是什么呢?

粗略的理解是我们能能共同理解的东西,就是数据,注意这里的焦点是共同,即这个数据是约定俗成的,普遍都能接受和理解的,你弄个火星文,肯定不是数据了。

互联网的工作对象是网络吗?不,网络只是通道;互联网行业的工作对象是数据,这些数据是由人来生产的,所以互联网行业最终的工作的对象还是人。

这一点希望大家铭记,互联网这个工具是为人服务的,你的工作对象最终还是人,数据只是表达的方式,就好像货车和公路的比喻,大家可以理解为数据就是我们需要的货物,而网络只是运输数据的通道,通过互联网最终的目的都是交换。

那么数据又包含哪些东西呢?这里我们只讨论互联网上的数据。数据又有两层表达,第一层是形式,第二层是含义。

我们先来讨论数据的形式,互联网的数据形式大约有7类,主要分为:

  1. 文字
  2. 数字(包含几何)
  3. 文件(图片视频及各种后缀格式的文件)
  4. 人群(用户)
  5. 时间
  6. 空间
  7. 货币

这七种主要的数据形式,进行排列组合后先表达出我们的对象,再由对象和对象之间的关系,表达出了我们世间的万物。

通过上图可以看到,数据是通过一层一层的逻辑关系,排列组合表达万物的。即使没有互联网,他们也是这么表达出来的。但表达出来后是需要进行传播的,互联网的跨空间使得传播更快更方便,注意这里说的更快更方便,实际在物理中的表达就是能耗最低原则,即数据总是通过最小能耗进行复制和传递(这一原则将导出共享经济)。

说了数据的形式后,我们再来看看数据的含义,不同的人或者人群,对同一个数据的含义及其理解,是不一样的。好比美国对华为的芯片供应商下达禁令这个事件,那不同国界、宗教、行业、年龄的人或者人群,对事件的看法都不一致(好比1000个人心中有1000个哈姆雷特吧)。即谈到数据含义,一定要和数据对象想结合,同一数据对不同对象,其含义不会完全一致。

三、数据的使命:繁殖

通常认为,数据只是人类用来实现交换的工具。这句我们来试着反向理解一下。

反向理解前,我们先讲个故事,中国有一位顶级钓鱼大师,叫化老(化绍新),有一句名言:“你要钓好鱼,必须拥有鱼一样的思维,才能钓好鱼”,这就是反向理解的案例。那么如果把你自己看作一个数据,来反向看人类,那你要干什么?

我们不难发现,几乎所有的数据,都在和其他数据发生作用,并时刻并产生新的数据(数据大爆炸),而且这一过程中不管你是否没有互联网,只要有人作载体的情况下,它都会发生。

那么我们是不是发现数据的这个行为和人类繁衍很相似,人类的目的就是基因驱使我们进行生息繁衍,其实数据也是一样,并通过我们人类(这种载体)进行传递和繁殖。

这个反向的视角有点超出我们的理解,而且这样反向思维的结论,也许会吓你一跳,即数据和基因比较类似,也许本身就有生命,人类(这种结构)只是数据繁衍生息的载体或者工具。数据先是寄居于人脑之中,但数据多聪努力啊,无数的数据通过协作,创造了电脑这个更大的空间(你都想换大房子,数据为什么不呢?)。原来的数据之间自由交流要面对面才行,速度太慢了,弄个互联网数据之间交流更快了(你都想坐飞机高铁,数据为什么不呢?),以上只是站在数据的角度看问题,之所以用这样的逻辑视角,是为了在你入行后,这种反向思维将更有利于从正反两个方向辩证的看待问题,能帮助你看到的现象其背后的本质,从而秒懂其现象的原理。我们下面就试着来用这个视角来回归理解一下我们日常所见的经济现象。

通常说哪个家族,哪个国家经济有活力,其实说到数据层面,无非是新的数据增加了。

为什么资本主义比较有活力,其实那是数据的自由恋爱嘛,计划经济活力不足,可以理解为指腹为婚嘛。这只是个比喻,但这里表达了一个最基础的概念,就是数据繁殖,好比你的互联网产品,如果不能让数据自由恋爱,并成指数级的繁殖,那么你要的产品设计,基本就是失败的。

淘宝美团,都是要求数据能快速配对,能快速合成新数据(生儿子了)。而百度呢,基本就是老数据,没有自我繁殖的能力,没孩子家族能兴旺吗?所以BAT快变成ATM了。

以上的举例不一定恰当,但目的为了强调一个核心原理,就是数据思维,即从数据的角度看人类,从这个反向角度去理解世界,或许你会觉得简单透彻。

那么我们再回来看看我们在互联网中的角色,就非常容易理解。不就是一个媒婆嘛,撮合数据之间发生关系并产生新的数据,生存并繁衍,就是数据存在的唯一目的。数据生存繁衍的整个过程中,都需要以能量作为维持(不管大脑还是电脑,都需要能量维持,谈到能量,是不是让你联想到质能方程…),能量就像数据的食物,维持其生息繁衍,我们逆向看待问题,并作了以上的比喻,目的是增加看待事物的角度,让我们对事物和现象有更深的理解。

四、理论的猜想:引力

前面说了三个部分:第一说了网络有啥用,第二概述了数据是啥,第三讲了数据想干啥,接下来说说这些数据怎么变化的,以及藏在这些变化的背后的规律是什么?

我们先来问个最简单的问题:你去淘宝买东西,价格一样的两家店,一家卖了100件,另一家卖了1件或者0件,你会选谁?——你说会选100件的这个店铺。

再进一步问你,为什么呢? 答案肯定很多了,但我们只是想从这个现象中,试图得到一个最简单的解释。

我们来做个简单的对比参照:

1. 牛顿的问题是:苹果为什么会掉下来?

牛顿用了最简单的方法,苹果是一个物体,地球是一个物体,两者之间一定存在某种引力,然后推导出万有引力。

2. 我们的问题是:你为什么要买那100件的?

在你选择前有一个主体数据,和两个客体数据,你的这个选择行为,表现出引力一样的现象,即数据仿佛和物质一样,数据之间也许存在万有引力,大数据天然比小数据有更大的质量引力。

为什么要用引力来解释呢?

因为人类进入数据时代不到半个世纪,但至今还没有形成任何数据理论,用以支撑所有的数据现象。

数据万有引力也只是一个假设性猜想,在这个大胆的假设基础上,力图进行小心的求证。

有了这个假设,我们很容易推出数据的其他几个属性:

  • 首先数据应该满足守恒定律:即数据不会新增,来源于其它一个或多个旧数据,但数据不会消失,分化于其它一个或多个新数据;
  • 其次数据也应该满足相似相容原理,也就是相似的数据总是放在一块的(空间);
  • 最后数据还应该满足质能方程,能量比较费解,但能量大家最熟悉的简单表达就是货币,即数据和货币之间的转换,在大系统中也应是守恒的。

以上都是基于假设的推演,我们的目的不过是想得到一个极简的数据理论,否则无法支撑大数据后时代的快速发展。

以上啰嗦这么多,就是想建立一个理论假设,用以支撑后续推演,当然你可能挑刺说“没有数学公式的理论都是假打”,这我承认,但我们的目的不是工程学范畴,只专注在对数据的极简解释和理解,只要这些假设和比喻有助于我们对复杂现象的简单理解就行了。要知道把简单的东西说复杂,那叫忽悠,要能把复杂的现象说出简单的道理,那才叫务实。

谈到引力,不得不说下数据世界的马太效应,为什么大城市比小城市更有吸引力,为什么头条更能吸引用户,为什么玩手机的时间比电视要多,这些现象都是因为引力的作用,而且如淘宝、头条这些数据群已有形成数据黑洞的趋势。

五、引力的公式:人性

现在的互联网动不动先来一句:你的商业模式是啥,商业模式的坑比比皆是,95%的互联网项目都会死掉,为什么呢?因为他的商业模式是用语文做的,不是数学做的,那么立项时的结论数据也是想出来,而不是算出来的,这样的PPT靠谱才是怪事。

商业模式简言之就是:你想在网络上做啥生意?

这里的核心是生意,网络只是这种生意的方式。既然是生意,那么应该和传统生意一样,做下测算,但是测算总要有基础数据吧。根据数据引力假设,商业模式是一定可以被计算出来的,这样一来,在商业模式的可行性上,语文描述就可能退出历史,而数学计算也许将被应用起来。而计算的依据就是数据引力这一基本假设,而这个假设的基础上,还需要一系列的公式,这个公式就是人性。

谈到人性前,我们先说一个人:百家讲坛中讲三国演义的易中天,讲完三国演义的结尾,有一句总结性陈词,那就是:

“纵观三国和中国历史,几千年来,什么东西都在变,但只有一个东西没变,那就是人心和人性”。

同理在我们的互联网设计中,一定要遵循一个不变的单一准则,这个单一法则,就是易中天所说的人性。人性是什么,其实人性用计算机语言描述,人性就是数据演变的遵循公式,所有静态的数据要进行繁殖或变化,则一定要经过公式,这个公式就是人性。

人性这个公式,似乎人人都懂,但那都是语文角度,如果不从数学角度出发,没法把人性这个公式用好的。

前面已经说到,互联网产品的设计要符合人性,其实何止产品,设计一个家庭、一个企业、一个社会组织,都要用到人性这个基本公式。因为人或人群才是数据的最终输入和输出载体,即根据我们小学的知识,设人性是一个X,为了算出这个X,我们就需要对我们的客户进行一个输入(问卷或行为模拟),然后得到一个输出(行为结果),即可以算出这个X的结果。

这就是我们商业模式最简单的计算方法,即你对你的客户群输入了你已有的数据,用户群如果输出的数据和你的预期不符,那么你就需要考虑你的商业模式是否合理了。

说了这么多,无非就是想说明一点,商业模式的基础是你的客户群所特有的人性公式,当然不同的互联网产品针对客户群体,诉求点也不同,也就是公式也会有差异。需要强调一点,互联网虽然是群用户,但输出这点有点像量子力学,即单个个体的输出无法被预测,但群体输出一定可以预测,而且群体越大,可预测性越强。

我们知道任何互联网项目,都有针对性的客户群体,对这个群体,只有线下的模式能走通,线上的模式才能走通,注意问卷基本是失效的。因为问卷是一种想象,而交易是一种行为,这两者是完全不同的,所以我们需要线下是存在的,才有可能搬迁到线上。

举例来说,价格是商品最为敏感的参数之一。

因为同种商品,客户都愿意购买低价更低,所以淘宝才发展了起来。你要想超过淘宝,必须比淘宝价格更低,于是拼多多起来了。但如果还想干掉拼多多,那只能是比拼多多价格更低。如此循环下去,价格不断降低。

对,这个结果你想到了,就是不买了,用租的模式,价格上才有可能实现碾压拼多多,租的模式已经改变了商品所有权(资本主义)为使用权(共产主义),量变就这么引起了质变。

之所以在商业模式里多费了些口舌,就是想提醒同学们,这个坑是最大的,如果没有理性的理工科思维,就凭一些文人骚客诗和远方的PPT,跳进去注定是起不来的。

以上聊了些对互联网的基础性认知,首先了解到互联网就做两件事:

从交流到交换;然后也知道了互联网的核心作用,就是用空间换时间;进而还了解了数据是如何积木式来表达万物的,核心通过逆向思维,用拟人的手法去理解数据的生存繁衍规律,并跳跃性地引出一个数据演化的引力假设,继续通过假设导入人性这个基本参数变量,最后用数学的方法讨论了商业模式的正确撰写姿势。

目的在接触到具体的互联网产品或者项目之前,通过角度的不同,对互联网有个整体的基础性认知,从而杜绝进入行业后的踩坑可能。

下个系列将进入互联网行业,通过互联网产品,聊一下从需求、设计、开发和测试等环节基础知识和方法,用白话文的方式,揭开互联网产品故作神秘的面纱。

而本系列的结尾,将试图运用数据万有引力的假设,推导出互联网产品将最终实现工具化的可能,终极意义在于:产品经理的宿命就是完成自我终结。

 

本文由@数据万有引力 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash, 基于CC0协议。

给作者打赏,鼓励TA抓紧创作!
2人打赏
评论
欢迎留言讨论~!
  1. emmm啊?emmmemmmemmm???啊??啊???

    回复
  2. 写得挺好,关于数据的逆向思维的观点有点意思哈哈

    回复