已经不记得当初为什么会买这样一本书,只知道它被搁置了很久之后,终于在最近被重拾。也许是出于内疚,我很认真地阅读了这本书,说实话,读过一遍之后,有很多是似懂非懂的,但确实有太多新的观点冲击到了我。“大数据”是当前很火的一个词,包括在学术界,很多优秀的学者已经开始投身于大数据的研究中,但我一直觉得大数据离我还很遥远,至少在我的研究领域不会涉及到太多。
认知冲击一:“样本=总体”。做研究的同学应该都知道,研究局限性之一就是对样本的选择,我们总是不能够获得所要研究内容的所有样本数据,所以,我们总是通过各种随机方法、检验模型等来尽可能的减少因数据问题带来的研究偏差。但大数据的发展,似乎让我们看到了未来巨大的改变。
认知冲击二:接受不精确。严谨、对结果的精益求精是一贯的科研态度,所有不精确的结果都存在很大的漏洞,都会被各路学者攻击和质疑,但随着大数据的发展,我们对数据的追求不再精益求精,一个错误的数据在成千上亿的数据面前显得太微不足道了,相比于以前小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事实的真相。
认知冲击三:对相关关系重要性的忽略。在我们教育的认知里,世间万物都是由千千万万的因果关系交织而成的。研究的背后也是在发现变量之间的因果关系,探究的重点也在寻找到底谁在影响,亦或是受谁影响。但在大数据发展的今天,相关关系才是大数据的核心。大数据的相关关系分析也更为准确和迅速,不易受偏见的影响。只有我们完成了对大数据的相关关系的分析,而又不满足于仅仅知道“是什么”时,我们才继续向更深层研究因果关系,找出背后的“为什么”。
如此说来,我们不能否认大数据给我们带来的巨大变化,既然是变化,那就会有好有坏,就像书中提到的,我们在利用大数据预测为我们打造一个更安全、更高效的社会的同时,却否定了我们之所以为人的重要组成部分——自由选择的能力和行为责任自负。大数据的不利影响并不是大数据本身的缺陷,而是我们滥用大数据预测所导致的结果。人们总是习惯性的从因果关系的视角看世界,因此,大数据也总是被滥用于因果分析,而且我们常常非常乐观的认为,只要有了大数据预测的帮忙,我们进行个人罪责的判定就会更高效。
最后用文中的一句话做总结:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”
写在最后的:下午突发奇想的想要开一个自己的公众号,随便写写什么都好,就这么随便的开了,也随便的写了,作为第一篇成品还存在很多不足,在以后的岁月里会慢慢改正,也希望能收到大家的各路意见和建议。公众号的内容我不会对自己有太多的限制,大家也只当是生活的一味调剂来看即可。
——来自一只不专心搞科研女子的疯言疯语录
领取专属 10元无门槛券
私享最新 技术干货