这是《算法图解》第十篇读书笔记,内容主要是K邻近算法的介绍。
K近邻算法(K-nearest neighbor)是一个给定训练数据,根据样本数据最近的K个实例的类别来判断样本数据的类别或数值的算法。该算法可细分为两种类型:判断样本类别的分类算法,计算样本数据的值的算法。
可用python的scikit-learn包实现K近邻算法。 调用包的方式如下:
from sklearn import neighbors
#K近邻算法的分类算法
classifier=neighbors.KNeighborsClassifier()
#K近邻算法的回归算法
regressor=neighbors.KNeighborsRegressor()
(1)可处理分类问题和回归问题。 (2)适合大样本情况下的自动分析。
(1)计算量大。 (2)样本不平衡时,对稀少类的分率准确率较低。