《利用Python进行数据分析》一书讲述了如何利用Python进行数据控制、处理、整理、分析等方面的基本要点和内容。同时,本书也是利用Python进行科学计算的实用指南。作者Wes McKinney是一名资深数据分析师,2007年获得MIT数学学士学位后从事量化金融方面的工作,开发了数据分析的著名开源Python库——Pandas。作者对各种Python库(如NumPy、Pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。
本书是学习Python数据分析最好的参考书之一,作者展示了Python的强大和灵活。不过本书的行文结构略为特别。前两章是背景概述,第三、四、五章分别介绍了iPython,NumPy,Pandas。第六到十一章是一些比较具体的功能的介绍以及实例,以Pandas的使用为主,中间插进专门讲一章述matplotlib,第十二章又回到NumPy。全书最后还附了一个大约三十页篇幅的Python快速入门。
本书中涉及到的大部分知识,在实际数据分析当中经常用到。但是对于已经具备一定Python数据分析经验的读者,本书可能会略显初级。但实际上书中还有很多对于有经验的读者来说很有价值的内容,主要集中在第四、五、八、十二章对NumPy,Pandas,matpotlib等工具库的介绍中。由于作者本身对这些工具有着深刻的理解,因而清晰的阐述了这几个工具库的设计思路、基本用法等,具有较高的阅读价值。本书重点介绍了用于高效解决各种数据分析问题的Python语言和库。但是没有阐述如何利用Python实现具体分析大型案例,因而对于初学者而言可能略微枯燥,所学不止何用,而且语法须反复阅读和实践才能记住。
如今本书英文版本第二版已于2017年10月20日已经出版,截至目前尚未有中译本出版。和第一版相比,作者对部分内容进行了升级:1.代码升级为Python3.6(本书第一版使用的是Python 2.7)。2.更新了Anaconda以及工具包的安装方法。3.增加了关于高级Pandas库的内容。
总体来说,《利用Python进行数据分析》一书含有大量的代码实践,以及大量综合方法的应用,是一本偏向应用的Python教材。作者对于利用Python进行数据分析有着很丰富的经验,因此本书写作风格深入浅出,易于读懂。本书是数据分析入门必读书,已成为Python领域中技术计算的权威指南,值得仔细品味。
【本文完成时间:2018年7月2日】
【编辑:陈东胜、韩莹莹】
领取专属 10元无门槛券
私享最新 技术干货