以上预测电影分类的算法就是 k -近邻算法(kNN)。...k -近邻算法的基本原理是:存在一个训练数据(每个样本都有特征和分类标签的样本集),输入没有分类标签的新样本后,依次计算新样本和各个训练样本的距离,找出最相似(最近邻)的k个已知样本,提取它们的分类标签...[ 98., 2.]])
>>> labels
array(['爱情片', '爱情片', '爱情片', '动作片', '动作片', '动作片'], dtype='<U3')
下面实现kNN...ranges #未知样本数据 归一化
X_label = classify(normX, normDataSet, labels, k=4)
print("预测的分类是:", X_label)
kNN...算法的优点是:精度高,对异常值不敏感(与异常值的距离较远),无数据输入假定。