如何成为一名数据科学家?
回答这个问题之前,让我们先认识什么是数据科学家?
《哈佛商业评论》2012年10月发表一篇文章,标题是【数据科学家:21世纪最性感的职业】。
1 数据科学家是什么?
数据科学家是遨游于数据的海洋中做出各种探索和发现的群体。
数据科学家能够知道数据在哪里,能够识别丰富的数据源,能够知道如何获取数据,并且把各种数据源如何整合起来。
数据科学家能够把各种数据进行结构化,从而使得分析和挖掘成为可能。
2 数据科学家技能谱
胜任和完成数据科学工作的八项核心技能
2.1 基本工具
熟练掌握统计编程语言,例如:R或者Python
掌握数据库查询语言,例如:SQL或者SparkSQL
2.2 统计学
理解基本的统计学知识,例如:p值、假设检验、分布和最大似然估计等
2.3 机器学习
理解和掌握机器学习方法,例如:k均值、k近邻、随机森林、集成方法等
2.4 微积分和线性代数
掌握统计学和机器学习里面涉及到的微积分和线性代数知识,帮助理解统计学和机器学习的原理。
2.5 数据处理
因为数据大部分是脏的,不能直接拿过来分析和挖掘,因此需要对数据做处理。
2.6 数据可视化和数据故事
掌握数据可视化和数据故事,向相关人士进行有效报告。
2.7 软件工程
掌握软件工程化思想和具备实现数据产品的能力。
2.8 数据科学家思维
知道有价值的数据问题是什么?解决这个数据问题的方法论是什么?如何与相关人士沟通和协调,从而整体推进和解决好数据问题。
参考资料:
1数据科学家:21世纪最性感的职业
2成为一个数据科学家需要的8项技能
您在阅读中,关于数据科学家修炼记,有什么需要补充的,请留言。
关于数据科学更多内容,请阅读数据科学系列文章。
文章推荐:
数据科学系列文章
1简明数据科学1
2简明数据科学2
3简明数据科学3
图片赏析:
领取专属 10元无门槛券
私享最新 技术干货