如今,数据对于现代企业的重要性不言而喻,无论是什么行业在当下互联网和移动互联网的赋能下,获取数据和信息变的比以往更加容易。如何让数据产生价值,如何减少信息不对称从而提高企业运营效率是每一家现代企业都应该关注和思考的。
作为一名数据科学家需要很挑剔,并且善于发现他人会遗漏的东西。
那么我们如何做到像数据科学家一样思考呢?
1
问题是最重要的
首先你要了解对于一个数据科学家或者数据分析师而言,什么是最重要的?是数据吗?是建模方法吗?还是编程工具?都不是,数据科学家开始工作的起点是源自问题。
无论是数据、方法还是工具都是为问题服务的,汇总大量的数据和信息,使用适当的方法和工具来回答问题,而不是仅仅基于一个人或者一群的人的个人经验和所处位置来进行决策,避免屁股决定脑袋。
2
如何发现问题
问题是数据的灵魂,如果没有准确定义的问题,那么数据科学家将无从下手。
数据科学家需要在寻常中发现不寻常。如果你有幸发现些什么的话,可能你就中奖了。
发现问题的途径有很多,企业中问题的发现多数是来源于企业内部的报表,财务报表或者BI报表。
财务报表是从财务的角度来检测企业是否健康,BI报表是从运营的角度来进行检测。BI报表对比财务报表的优势是更加实时,可以做到隔周、隔天甚至更快的监控。BI报表对比财务报表的劣势就是不够标准化,而且也没有合规需求。
3
如何回答问题
信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,使分析结果可视化,数据可视化借助于图形化手段,可以清晰有效地传达与沟通信息。数据可视化除遵循各公司统一规范原则外,具体形式还要根据实际需求和场景而定。这是对于数据科学家来说十分重要的技能之一。
4
分析方法
统计学的经典分析方法有上百年的历史了,无论是描述性统计还是预测性统计,贝叶斯统计还是经典统计,无监督学习或是有监督学习。这些不同的方法都可以在不同的场景中发挥作用,但没有一种方法是可以解决所有问题的。
数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务操作过程中便于业务理解和实施是关键。
———— / END / ————
领取专属 10元无门槛券
私享最新 技术干货