本期为大家推荐的书籍是《Python数据挖掘入门与实践》
本书的作者Robert Layton是计算机科学博士,网络犯罪问题和文本分析方面的专家。多年来一直热衷于Python编程,参与过scikit-learn库等很多开源库的开发,曾担任2014年度“谷歌编程之夏”项目导师。他曾与全球几大数据挖掘公司密切合作,挖掘真实数据并研发相关应用。他的公司dataPipeline为多个行业提供数据挖掘和数据分析解决方案。
本书分12章进行论述,第一章先简单介绍了安装Python的步骤和演示一下简单的数据挖掘算法,比如亲和性分析和分类问题。第二章重点讲述分类问题,在这一章提出了建立估算器的思路去处理数据,估算器可以看做是数据流水线处理的第一车间。第三章讲述了用决策树算法预测一个实际问题,并提及了一下随机森林这个机器学习范畴的算法。第四章深入讲解用亲和性分析算法去分类。第五章讲述用转换器提取特征。第六章讲解朴素贝叶斯算法,作者在这一章用该算法进行了对社会媒体的挖掘,其本质是文本挖掘。第七章讲解用图挖掘。第八章讲解用神经网络破解验证码。第九章解决归属问题。第十章用聚类方面的算法对新闻语料进行分类。第十一章用深度学习对图象中的物体分类。第十二章讲大数据在现实中的应用。
总的来说,本书的作者从众多的算法中挑选出了较为经典的几类算法,用实际问题为我们讲解了用Python怎样去实现这些算法和解决实际问题。本书深入浅出,每一章都是一环扣一环,层层递进,初学者在阅读这本书时,要多去参考其他的书籍或网络,这样才能掌握本书的精髓。
编辑:黄一鸣
排版:何晓芙
责任编辑:何晓芙
领取专属 10元无门槛券
私享最新 技术干货