你好,数据科学家,
我正在处理一个复杂的分类/预测问题,我发现很难将这些类分开。即使在PCA之后,我的数据(在两台PCA上)看起来也是这样的:
考虑到这个数据集,哪种方法可以最准确地预测类?
背景:我试图通过最好的方法/算法来解决建模的问题。
非常感谢,
发布于 2017-07-14 08:31:19
你的问题没有人监督吗?如果不是,数据不需要在二维上“视觉上”可分离,您可以使用多维分类器为您创建分离(线性或非线性,只是取决于分类器)。
如果您的问题是无监督的,尝试其他方法来聚类数据,如K均值或基于树的聚类(即分层)。
发布于 2018-01-13 20:05:47
数据在2-D中可分离是不重要的。您可以尝试PCA + SVM组合来检查数据的最佳分离点(维数)。您可以通过网格搜索PCA的参数来完成这项工作。
如果你只是在可视化数据,你也可以尝试the嵌入。
https://datascience.stackexchange.com/questions/20435
复制相似问题