是否有一个机器学习算法的名称,它从聚类数据点的例子中学习“聚类方法”(每次使用不同数量的集群)?
想象一下,训练集是一组集合,并分配了它们的集群。
有没有人在任何文献中遇到过类似的问题?我的目标是阅读更多关于这个问题的内容。
Example #1:
Underlying rule: "cluster words to the same group if they do exist on the same page of an imagined storybook"
Training dataset:
1) Source values: [banana,car,rock,ora
我对统计学、Python、机器学习和Scikit学习都很陌生。然而,我正在尝试这个项目,我有35列学生数据的CSV。第一列是ID,我想我可以忽略它。最后三栏是一年级、二年级和三年级。我有400排。我想看看我是否能用它学习一些机器学习,并对我所拥有的数据有所了解。现在我了解了Scikit在Numpy数组上的工作,它不处理性(“男性”、“女性”)等分类数据。所以我把所有的30个类别都编成了法典,其中1种是男性,2种是女性,等等。然后,我做了以下工作
X = my_data[:,1:33]
y = my_data[:,34]
from sklearn.linear_model import Line