关注网易智能,聚焦AI大事件,读懂下一个大时代!
(机器学习算法地图见文末)
圣诞节的赠书活动来了!
这次智能菌为大家推荐的书是《机器学习与应用》,这本书由清华大学出版社出版,是机器学习和深度学习领域又一高质量的入门与提高教材。该书系统、深入地讲述了机器学习与深度学习的主要方法与理论,并紧密结合工程实践与应用。
全书由21章组成,共分为三大部分。第1~3章为第一部分,介绍机器学习的基本原理、所需的数学知识(包括微积分、线性代数、概率论和优化方法),以及机器学习中的核心概念。第4~20章为第二部分,是本书的主体,介绍各种常用的有监督学习算法、无监督学习算法、半监督学习算法和强化学习算法。对于每种算法,从原理与推导、工程实现和实际应用3个方面进行讲解,对于大多数算法,都配有实验程序。第21章为第三部分,介绍机器学习和深度学习算法实际应用时面临的问题,并给出典型的解决方案。此外,附录A给出各种机器学习算法的总结,附录B给出梯度下降法的演化关系,附录C给出EM算法的推导。
本书作者为雷明,毕业于清华大学计算机系,研究方向为机器学习、计算机视觉。有超过12年的学术研究与产品研发经验,曾发表论文数篇,具有深厚的理论功底与丰富的实践经验。其撰写的系列技术文章在半年内累计阅读量达数百万次,擅长用生动、形象的语言把复杂、抽象的理论和算法解释清楚。
精彩试读
1、含括学术界与工业界最新成果
完整的讲述了机器学习、深度学习主要算法以及在各个领域的典型应用,含括了学术界与工业界截止2017年初的新成果,紧跟时代步伐,弥补了市面上经典教材内容老化的缺憾。
试读:
图像超分辨的目标是由低分辨率的图像得到高分辨率的图像,传统的做法大多采用纯图像处理的技术。用机器学习的思路解决超分辨问题取得了更好的效果,卷积神经网络被成功地用于超分辨问题。文献[7]提出了一种用生成对抗网络框架解决图像超分辨问题的方法,称为超分辨生成对抗网络,简称SRGAN,能够将缩小4倍以上的图像进行复原。
这种方法使用了一种新的损失函数,由对抗损失和内容损失两部分构成。第一部分损失和标准生成对抗框架相同,通过一个判别模型,让生成网络生成的超分辨图像和真实高分辨率图像尽可能接近。
生成器卷积网络采用了深度残差网络;判别模型也是一个层次很深的卷积网络,用于区分一张图像是真实的高分辨率图像还是由生成器网络生成的图像。网络结构如下图所示。
图:图像超分辨的网络结构
2、推导论证清晰、深入、详细
绝大部分核心算法均有详细的推导、证明过程,从问题本源、思想层面对算法进行讲解,让读者不仅知其然还知其所以然,真正掌握算法的思想与精髓。在书的前部对机器学习所需的数学知识也做了系统的讲解
试读:
3、核心算法配有实现细节介绍,使用示例,知名开源库代码分析
对大部分核心算法的实现细节进行了介绍,并配有示例程序与知名开源库源代码分析,包括OpenCV,libsvm,liblinear,Caffe,这对需要使用、实现机器学习算法的读者至关重要
试读:
求解器的实现是源代码分析的核心,分为可信域牛顿法与坐标下降法两类。可信域牛顿法由TRON类实现,坐标下降法由各个问题具体的求解函数实现。限于篇幅,在这里只分析一部分求解器,其他的实现原理类似。
可信域牛顿法由类TRON实现,这个类为L2-正则化logistic回归和L2-正则化支持向量机的训练提供支持。类定义如下:
4、重要算法的实际应用均有讲解
核心算法的实际应用都有介绍,对深度学习技术在计算机视觉、语音识别、自然语言处理、计算机图形学等领域的应用情况有详细而深入的介绍。这些内容能帮助读者掌握算法的实际应用方法、建模的思路。
在本书的核心算法部分介绍了机器学习和深度学习的主要算法,包括:
线性回归
岭回归
LASSO回归
贝叶斯分类器
决策树
K近邻算法
距离度量学习
数据降维算法,包括主成分分析、流形学习
线性判别分析
人工神经网络
支持向量机
logistic回归
线性支持向量机
softmax回归
Bagging算法与随机森林
boosting算法
高斯混合模型
隐马尔可夫模型
自动编码器
受限玻尔兹曼机
卷积神经网络
循环神经网络
生成对抗网络
聚类算法,包括层次聚类、k均值算法、
DBSCAN算法、OPTICS算法、EM算法、均值漂移算法、谱聚类
半监督学习,包括自训练、协同训练、生成模型、半监督支持向量机、基于图的算法、半监督深度学习
强化学习,包括策略迭代算法、价值迭代算法、蒙特卡洛算法、时序差分算法、深度Q网络、策略梯度算法
在工程实践部分介绍了机器学习算法在工程应用时面临的问题与解决方案,包括:
样本的收集与标注
特征工程
算法与模型选择
过拟合问题
安全性问题(对抗样本)
计算与存储成本问题
深度神经网络模型压缩与优化
附:机器学习算法地图
Tips
【赠书说明】
领取专属 10元无门槛券
私享最新 技术干货