现在很多所谓的大数据,其实拆穿了就是统计图表,与其高大上的外表相比,其价值是可笑的。我们先来说说现在的大数据误区之一:数据量要大,越大的数据才越有用,越有说服力,吃瓜群众可能真的信了,毕竟只是看看热闹——某公司每日新增数据N个PB,占市场比重超过一半等等亮瞎钛金眼球的数据,但是我们问一句有何用?真的是数据越大越好?
学生时代有一门课程,是我很喜欢的一门课程,不仅仅因为是全英文教学可以在同学面前秀下英语,更关键的是这门课程讲的内容。
不卖关子,课程名称简称DA。不是Data Analysis,而是Decision Analysis。两者间有什么区别呢?今天我就通过一个案例对比介绍,顺带说说大数据多层价值。
假设南方沿海某地有一个农民,他有块地,每年年初他都要决定今年种什么。一般是两种选择,种A或B作物。如果种A作物,预期获得的收益为10000元,种B作物预期获得的收益为7000元。但如果遇到台风的话,A作物的收益直接降为0,B作物则还能收益3000元。而根据经验,今年遇到台风的可能性是60%,问农民应该种什么?
面对这个问题,我们首先发现这里有很多我们现在大数据的第一层价值:统计分析--作物收益。
那第二次价值呢:给出预测--台风发生的可能概率,这对指导农民选择种什么很有价值--决策辅助。
现在的大数据能做到第二层已经是很不错的了,毕竟给出了预测。但难道我们不能再做点什么么?
我觉得大数据的第三层应用:给出更优方案!因为上述2个层面,并不能保障农民种植获利最大化。作为大数据应该跳出当前的限制,给出其他解决方案。比如C作物,即使有台风也能获取10000收益。这应该才是这个农民最想要的。而这也是大数据现阶段最应该做的。
领取专属 10元无门槛券
私享最新 技术干货