1、工业大数据的本质是以数据形式呈现的“信息”或者“知识”,而不是没有关联的数据。“信息”和“知识”的本质接近,差别在于:“知识”在时空上的更具有更强的通用性和连续性。没有关联的数据是垃圾。
2、工业大数据的核心价值是知识的重用。大数据带来的好处是:获得知识的成本低、范围广、质量高。智能化使得知识在人机之间共享、促进了知识价值体现;互联网让知识的价值倍增。知识价值的提高,会让人们值得花更大的力气去发现价值、形成大数据工作的良性循环,让知识工作的价值暴增。
3、知识来源。最好的做法是:数据就是知识,如产品设计的结果。其次,是让数据(信息)很容易地提炼出知识。再次,是尽量让数据包含知识。最差的做法是:数据是垃圾、数据之间的联系消失、不包含知识。由此观之,从知识的角度看,数据的准备过程,可能比分析过程更加重要。
4、数据分析是知识的获取过程。但获取什么知识,服从于业务需求的。所有需要用到数据分析的地方,首要任务和工作重点,是理清业务需求的脉络和逻辑,把业务需求转化成一个便于分析的数学问题。而不是随便拿来一堆数据来乱分析。
5、最初的大数据关注数据的二次应用。数据来源服从于一次应用的需求。但随着大数据的发展,二次应用本身变得非常重要。一次应用和二次应用的界限会变得模糊。
领取专属 10元无门槛券
私享最新 技术干货