首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么客观世界的底层是数据

之前聊过,世界有三重现实:主观现实、客观现实、观念现实(互为主体现实)。观念现实的底层逻辑是故事。那么客观世界呢?很可能,是数据

老说底层逻辑、底层逻辑,什么是底层?我觉得就是万事万物中所共通的东西,最下面、最基础的、最本质东西。世界纷繁芜杂,各种事情,如果一个一个看,各有各的道理,最后在脑子里就是一团乱麻。而底层逻辑是他们共通的规律,从底层的角度去看,也许能看的清楚明白一点儿。

数据是客观世界的底层逻辑,这么牛掰的观点,当然不是我说的,是我学来的。很多牛人论述过,但我觉得论的最透彻的,还是《未来简史》(详见第11章:信数据得永生)。

《未来简史》这本书是有争议的,不少专家认为尤瓦尔赫拉利没什么理论创新,只不过把各领域的研究成果抄袭过来并穿了起来。我就奇怪了,重新穿起来难道不是创新吗?一件事情火了以后,必然毁誉参半,这是人性。所以别人怎么说都不重要,最重要的是自己的独立思考和判断。我觉得他说的有道理,能帮助我更好的思考和理解世界,我就信了,就这么简单。

说回数据。为什么说它是底层逻辑呢?因为世界上的万事万物,究其本质,都可以将其理解为数据。从小往大了举例子哈。

比如眼前这本书,它的尺寸大小,它的颜色排版,它的文字内容,其实都是可以数据化的,都可以变成计算机中的和1去处理。

比如中午食堂的午餐,盛了一盘子,什么都有,是数据么。食物的种类、质量、温度、卡路里、营养成分、甚至分子构成……只要往细了分析,也是可以转化成各种数据。

再往大,比如交管局,这个组织,可不可以数据化?我觉得是可以的,虽然很复杂,虽然很多我们还没尝试,但要是仔细抠,其实都是可以用数据去描述的。那么交通管理这项工作职能呢?其实质就是每天路面上大量的信息数据涌过来,然后我们这个系统,去分析处理这些数据,相应的采取行动。这个过程本质上是数据处理的过程。

《未来简史》里讲得更牛B,说每个人都是一种生化算法,都是一个数据处理单元,各种组织、各种国家就组成了更大数据处理网络。比如什么计划经济、市场经济,其本质区别是数据处理的方式不同(集中式还是分布式),所以在效率和效果上有了高下之分。

以前我们如果遇到一件棘手的事情,往往是定性的分析,然后说出一大推道理,靠道理靠感觉去组织大家干事情。我们甚至会觉得如果定量分析,抠得太细,是格局太小,不懂政治和管理的艺术。随着科技发展,测量、感应、统计、计算能力的跨越式发展,无数事实正在告诉我们:一切皆可量化

新的科技主义、数据主义就是在倡导这样的观念,就是一切事物、一切事情都可以数据化,并以数据化的方式去处理和解决。我一开始也狐疑,但是仔细想、慢慢想,真的想不到一个反例。各位也不妨试试看,看能不能想到一个事情是完全不可以被数据化的?

以上说数据是底层、是本质,说万事万物皆可数据化,其实还是停留在理念层面。那么具体的技术层面,怎么把事物数据化呢?这几天看书听课,了解到关于数据的一些技术知识,有种醍醐灌顶的感觉,分享一下。

人民大学王珊教授,是一位老教授,她讲《数据库系统概论》,讲了数据库技术的发展历史。经历几代发展,直到现在,最成熟最好用的数据库是什么呢,关系数据库。它怎么表达数据呢,就是用一个个关系,而关系的具体形式就是,没错,就是我们耳熟能详的表格。听起来一点儿也不高大上,谁不会画表格呀,上一代人就用,现在小孩儿也会。可就是这么个玩意儿,经过时间和现实检验,能够最有效的表达数据。

以前说起excel,觉得不就是个制表软件嘛,跟word一样,最基本的办公软件呗,很低端的感觉是吧。但据说excel的数据整理和分析功能很强大,只是我们不懂而已。我现在依旧不懂,但我想为什么一个制表软件有强大的数据分析功能呢,也许就是因为,表格这种形式是数据用以表述世界的最有力载体。

同理,我们说点高端的。

北大张志华教授,机器学习专家,早年在上海交通大学的时候讲过一门课,绝大多内容我听不懂,但关于数据本质那段儿我听懂了。他说:“数据是什么?数据就是矩阵。”

怎么讲呢,如果我们试图用数据去表述并管理一个事物,比如说交管局的警力资源吧,当然也可以是别的,可大可小,任意去想。这个事儿有n个样本(每个样本是一个民警),每个样本有p个特征(年龄、学历、身高、住址、奖惩……可以无限多),x是特征值。那就可以写成一个矩阵:

如果有新警进来,就增加n,如果觉得不够细致,就增加p。也就是说,通过这样一个矩阵,理论上,我们就完全可以把警力资源描述清楚。

其他问题也一样可以套用。比如人脸识别,n就代表一个个脸的样本,p就是每张脸的各种特征,x就是特征数值。比如自然语言处理,n就是一个个语言文字样本(一句话一段文字),p就是拆分的一个个单词,x就是每个单词出现的频率。其他身边的任何问题,如果有兴趣的话,都可以矩阵的方式去数据化,挺有意思的。而且能看到,其本质和表格差不多。

万事万物变成数据、变成矩阵,有什么用?

大家知道矩阵是个数学名词,有个数学分支叫《线性代数》,专门就是研究矩阵计算的。大学里学过,那时觉得,这是什么破玩意儿,没有任何用处,完全是数字游戏,而且这么难,根本学不会。我大学期间只有一门课程不及格,就是《线性代数》。现在知道有什么用了,就是万事万物都可以变成矩阵,然后进行计算。这就厉害了,现在什么机器学习、人工智能、数据挖掘,最根本的都是对各种矩阵的加工和运算。

现实的本质是数据,数据的本质是矩阵,而矩阵可以运算。也就是说这个世界任何事情,理论上都将是可以运算的,任何难题也都是可以通过数据运算解决的。其实现在已经实现了很多很多,有的让我们惊掉下巴,而未来恐怕只会走的更快更远,掉下来的下巴会更多。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180502G131B000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券