我们正处于一个数据科技(Data Technology,DT)时代。在这个时代,我们的一举一动都能在数据空间留下电子印记,于是海量的社交、电商、科研大数据扑面而来。然而,太多的数据给人们带来的,可能并不是更多的洞察,反而是迷失。
因为仅就数据本身而言,它们是“一无所知”的。数据的价值,在于形成信息,变成知识,乃至升华为智慧。也就是说,这些数据如果不能进一步被“深加工”,即使数据量再“大”,也意义甚小。
于是,就派生出这么一个问题:这些数据,由谁来深加工?其实,早在2012年,《哈佛商业评论》就刊登了一篇文章并给出了答案,进行数据深加工的人就是“数据科学家”。文章还断言,数据科学家是21世纪最“性感”的职业。
但如何成为一名数据科学家,尤其是一名“性感”的数据科学家呢?
埃里克·莱斯(Eric Ries)曾写过一本有关创业的书,书名是《精益创业》(The Lean Startup)。这本书中有一个概念深入人心,那就是“最小可行产品”(Minimum Viable Product,MVP)。围绕这个概念,创业者在创业初期不可贪多求全,而应该先做出一个最小的可用产品,拿到市场上去检验,然后根据反馈反复迭代,打磨升级,最终做出比较完善、比较成功的产品。
后来,有人提出类似概念MAKE——最少必要知识,Minimal ActionableKnowledge and Experience。这个概念让人恍然大悟!“如何成为一名数据科学家”这个问题的答案也几乎呼之欲出——You can MAKE it!
先来说说什么是MAKE。它指的是入门某个新领域切实可行的最小知识集合。MAKE说起来好像比较高级,但实际上,它背后有一个支撑它的朴素原则——Pareto原则(亦称80-20原则),即80%的工作问题可以通过掌握20%的知识来解决。
同样,想成为一名“性感”的数据科学家,一条路自然是按部就班地学习所有技能——十年磨一剑,但这样做的风险在于,当你“携剑下山”时,别人可能已经用上了飞机、大炮。这样的对垒,你胜算几何?
其实还有另一条备选之路,那就是走一走MAKE之道。在学习某项技能(如Python、数据分析、机器学习)时,我们要想办法在最短的时间内,摸索清楚这项技能的“最少必要知识”。一方面,它已然可以帮我们解决工作中的大部分问题;另一方面,入门之后,技能的提升通道可以在实践中寻得,缺啥补啥。有明确的任务导向,学习就会有如神助,这也是当前时代的快节奏学习法。
《Python极简讲义:一本书入门数据分析与机器学习》这本书的定位就是,为初学者提供关于数据科学的“最少必要知识”,从而让你获得那份最“性感”的工作。这些知识包含了成为数据科学家所需要掌握的基础内容——Python编程、数据分析、机器学习。
这本书共分10章,涉及的知识点很多,但精而不杂,层层递进。就像上面所提到的,这些知识点就是入门数据分析与机器学习的“最少必要知识”。按照大的范围来看,这本书涉及的内容大概可以分为三个维度:Python语法及技巧、数据分析必备技能、机器学习相关知识。具体来说,每一章的内容简介如下。
通过阅读这本书,不仅可以走好MAKE之道,还能找到一条不错的人工智能学习曲线!赶紧读起来吧!
内容简介:本书以图文并茂的方式介绍了Python的基础内容,并深入浅出地介绍了数据分析和机器学习领域的相关入门知识。第1章至第5章以极简方式讲解了Python的常用语法和使用技巧,包括数据类型与程序控制结构、自建Python模块与第三方模块、Python函数和面向对象程序设计等。第6章至第8章介绍了数据分析必备技能,如NumPy、Pandas和Matplotlib。第9章和第10章主要介绍了机器学习的基本概念和机器学习框架sklearn的基本用法。对人工智能相关领域、数据科学相关领域的读者而言,本书是一本极简入门手册。对于从事人工智能产品研发的工程技术人员,本书亦有一定的参考价值。
作者简介:张玉宏,大数据分析师(高级),2012年于电子科技大学获得博士学位,2009—2011年美国西北大学访问学者,2019—2020年美国IUPUI高级访问学者,YOCSEF郑州2018—2020年度副主席。现执教于河南工业大学,主要研究方向为大数据、机器学习。发表学术论文30余篇,先后撰写科技图书7本,参与编写英文学术专著2部。