腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
如何在适当缩放两个轴的情况下使用k-means算法对导入的数据集进行聚类
模型出错了,请稍后重试~
相关搜索:
如何在不使用笔记本进行内置算法的情况下对s3上的训练数据进行预处理
php里怎么获取长度
php 二维数组参数
php循环查找数据库
php添加数据库数据
php 自动抛出异常
php ping代码
php后台需要做什么
php时间可以加减吗
php投票系统百分比
相关搜索:
如何在不使用笔记本进行内置算法的情况下对s3上的训练数据进行预处理
php里怎么获取长度
php 二维数组参数
php循环查找数据库
php添加数据库数据
php 自动抛出异常
php ping代码
php后台需要做什么
php时间可以加减吗
php投票系统百分比
页面内容是否对你有帮助?
有帮助
没帮助
相关·
内容
文章
问答
视频
沙龙
2
回答
你使用什么方法来选择k-means和EM中的最佳聚类数?
、
、
、
有许多聚类算法可用。一种流行的算法是K-means算法,其中,基于给定数量的聚类,该算法迭代以找到对象的最佳聚类。 在k-means聚类中,您使用什么方法来确定数据中的聚类数? R中是否有可用的包包含用于确定正确的集群数量的V-fold cross-validation方法? 另一种常用的方法是期望最大化(EM)算法,该算法为每个实例分配一个概率分布,该分布表示该实例属于每个集群的概率。 这个算法是在R中实现的吗? 如果是,它是否具有通过交叉验证自动选择最佳聚类数量的选项? 您是否更喜欢其他的聚类方法?
浏览 1
提问于2010-02-23
得票数 13
1
回答
如何在k-means聚类中使用tfidf值
、
、
、
、
我在使用sckit-learn库的TF-IDF中使用K-means聚类。我知道K-means使用距离来创建聚类,距离用(x轴值,y轴值)表示,但tf-idf是一个单独的数值。我的问题是,这个tf-idf值是如何通过K均值聚类转换为(x,y)值的。
浏览 20
提问于2020-02-19
得票数 2
回答已采纳
3
回答
R中丢失类别和数值的聚类算法
、
、
、
我想在R中缺少分类和数值的数据集上执行营销细分聚类。由于缺少值,我无法执行k-means聚类。 R版本3.1.0 (2014-04-10) 平台: x86_64-apple-darwin13.1.0 (64位) Mac OSX 10.9.3 4 4GB硬件驱动器 在R中是否有一个聚类算法包可以适应部分填充速率?查看关于缺失值的学术文章,研究人员为特殊用例创建了一个新的算法,这些包在R中不可用。例如,具有软约束的k-means和具有部分距离策略的k-means聚类。 我有36个变量,但下面是前5个变量的描述: head(df) user_id Age Gender Househo
浏览 1
提问于2014-06-04
得票数 9
1
回答
如何用R显示聚类图?
、
、
我使用使用R的k-means聚类,并将数据集划分为两个聚类 clus.data <- df[,1:14] head(clus.data) heart.cluster <- kmeans(clus.data,2) 如何绘制带有集群的图形来查看它们?
浏览 55
提问于2020-11-18
得票数 0
回答已采纳
4
回答
关于不同k-means算法的质量
、
、
我看到对于k-means,我们有Lloyd算法,Elkan算法,我们还有k-means的分层版本。 对于所有这些算法,我看到Elkan的算法可以在速度方面提供提升。但我想知道的是,所有这些k-means算法的质量。由于它们的启发式和概率性质,每次我们运行这些算法时,结果都会不同。现在,我的问题是,当涉及到k-means这样的聚类算法时,如果我们想要有更好的质量结果(比如在较小的失真等方面)。在所有这些k-means算法中,哪种算法能为您提供更好的质量?有没有可能测量这样的东西?
浏览 0
提问于2012-12-13
得票数 4
回答已采纳
2
回答
在java中聚类数以千计的文本文档
、
、
是否有有效的方法对文本文档进行聚类?我考虑过K-Means算法,但它似乎太耗时了。有人能给我提供一个有效的方法吗?
浏览 2
提问于2010-12-24
得票数 3
回答已采纳
2
回答
在R commander的S_Dbw输出中,"Inf“是什么意思?
、
我已经运行了clv包,它由S_Dbw和SD有效性索引组成,用于在R commander中进行聚类。() 我用S_Dbw索引评估了DBSCAN,K-Means,Kohonen算法的聚类结果。但对于所有这三种算法,S_Dbw都是"Inf“。 它是“无限”的意思吗?为什么我要面对"Inf“这个词。我的聚类结果有什么问题吗? 一般情况下,什么时候S_Dbw索引结果是"Inf"?
浏览 0
提问于2012-11-01
得票数 2
回答已采纳
1
回答
K-means聚类,如何在垂直方向上划分数据?
、
、
、
、
我尝试使用K-means聚类方法来划分我的数据帧的三个部分。我在两个不同的数据帧中使用了相同的方法和代码。在我的第一个数据帧中,我得到了3个集群,它们垂直分离,这是我想要的。但在第二个版本中,它水平地对我的数据进行了聚类。怎样才能修复它?我还需要在第二个数据帧中垂直分隔我的值。 这些Dataframe的大小和列名相同,但行值不同。 () () kmeans = KMeans(n_clusters=3).fit(dataframe1) centroidsValues = kmeans.cluster_centers_ plt.scatter(dataframe1['StoreNumbe
浏览 0
提问于2019-08-22
得票数 0
2
回答
opencv Freak -我可以在BOW中使用Freak特征描述符吗?
、
我正在尝试使用opencv中的Freak来检测特征并提取描述符,然后构建我的弓词汇表,并为每个图像使用词汇表来匹配弓。你知道,整件事。我知道BOW可以与其他描述符一起使用,如SIFT或SURF,但我不清楚Freak描述符(二进制)是否可以与BOW一起使用。更具体地说,当opencv构建BOW词汇表时,它使用k-means聚类。我不清楚k-means聚类算法使用的是什么距离函数。对于像Freak这样的二进制描述符,Hamming距离似乎是唯一的选择。 在我看来,opencv k-means在计算距离时只使用欧几里德距离。看起来我必须建立我自己的k-means和我自己的词汇表匹配。有没有聪明人知道
浏览 7
提问于2012-11-12
得票数 4
1
回答
聚类分类器与聚类策略
、
、
我正在研究mahout中的K-means算法,在调试时,我注意到在创建第一个集群时,它执行以下代码: ClusteringPolicy policy = new KMeansClusteringPolicy(convergenceDelta); ClusterClassifier prior = new ClusterClassifier(clusters, policy); prior.writeToSeqFiles(priorClustersPath); 我在读这些课程的描述,但我不清楚. 我想知道这些聚类分类器和策略的含义是什么?它与层次聚类、质心聚类、分布聚类等有关吗? 因为我不知道
浏览 1
提问于2014-03-25
得票数 0
回答已采纳
1
回答
关于聚类方法的问题
、
、
、
最近,我开始学习数据挖掘中的聚类,我已经学习了序列聚类、层次聚类和k-means。 我还读到了一篇关于k-means与其他两种聚类技术的区别的声明,称k-means不太擅长处理名义属性,但文本并没有解释这个point.So,我能看到的唯一区别是,对于K-means,我们将提前知道我们将确切地需要K个聚类,而我们不知道其他两种聚类方法需要多少个聚类。 那么,谁能在这里给我一些关于为什么这样的陈述存在的想法,即k-means在处理名义属性的例子时会有这个问题,有没有办法克服这个问题? 提前谢谢。
浏览 2
提问于2010-11-04
得票数 6
回答已采纳
1
回答
在一定距离内的网格中寻找顶点
、
、
、
、
我有一个三维网格,它由一定数量的顶点组成。 我知道有些顶点彼此非常接近。我想找出其中的几组,这样我才能使它们正常化。 我可以做一个KD和基本的NNS,但如果我没有参考点的话,那就不是很好了。 我想找出这些小组与所有要点有关的情况。 在我的搜索中,我也发现了k-的意思,但我似乎无法用科学的描述来确定这是否真的是我所需要的。 总的来说,我对空间算法不太熟悉。我知道在哪里可以应用,例如,在这种情况下,但我缺乏实际的诀窍,甚至有正确的关键字。 那么,是的,对于这样的任务,有什么算法呢?
浏览 0
提问于2019-07-25
得票数 1
回答已采纳
2
回答
如何在k-means中找到簇的坐标
、
我正在尝试对key-value类型的向量使用k-means聚类。我的问题是,如何设置向量中每个元素的坐标?具体地说,键值对是字符串浮点数。我需要这个来稍后找到集群的中心。
浏览 17
提问于2011-03-05
得票数 0
回答已采纳
1
回答
小批量K-均值算法与顺序/在线KMeans算法的差异
、
、
、
我正在使用scikit learn库sklearn.cluster尝试K-Means及其变体的示例。小批量K-Means聚类和在线/顺序K-Means聚类有什么不同? 我在scikit库中找不到在线KMeans的实现。如果批次大小为1,那么minibatch K-Means将充当在线K-Means吗?
浏览 20
提问于2019-11-07
得票数 1
回答已采纳
1
回答
活动相似度评分模型?
、
这是一个非常高层次的问题。我正在寻找一种技术或模型,可以采取人们的网络活动,并能够产生一个基于相似性的分数。因此,具有相似流量模式的人,特别是那些在整个集合中不常见的人,得分会高得令人难以置信。 我愿意做研究,我只是想得到正确的方向。聚类分析是否能够将具有相似活动的人聚在一起?
浏览 0
提问于2015-03-19
得票数 0
2
回答
高维向量的最佳聚类算法
、
、
我正在尝试对一组45维的数据点向量使用某种聚类方法。我对数据点的聚类比较陌生,我想知道是否有人能指出合适的方法来使用?我曾尝试使用K-Means聚类,但我想知道我的数据的维度是否太大了?
浏览 1
提问于2019-05-29
得票数 1
1
回答
不同的聚类标签
、
、
我正在尝试对训练期间未见过且仅包含在测试数据中的新数据进行聚类。训练文件有5个类,而测试数据有7个类(5 +2),其中2个是新类。现在,我想运行k-mean来为新添加的类找到合适的簇,或者如果它们不靠近任何簇,就为每个类创建新的簇。 这是我的代码的一部分: print("Reading training data...") #mydata = pd.read_csv('.\KDDTrain.csv', header=0) mydata = pd.read_csv('.\PTraining.csv', header=0) # select a
浏览 3
提问于2017-02-25
得票数 0
3
回答
确定k均值聚类的准确性
、
、
我想使用sklearns k-means聚类函数对鸢尾花数据集(我去掉了标签,所以现在它是一个未标记的数据)进行分类。我已经建立了预测模型,输出似乎在很大程度上正确地对数据进行了分类,然而它是随机选择标签(0,1和2),我无法将其与我自己的标签进行比较来确定准确性(我将setosa标记为0,versicolor标记为1,virginica标记为2)。有没有办法给这些花贴上正确的标签? 代码如下: from sklearn.cluster import KMeans cluster = KMeans(n_clusters = 3) cluster.fit(features) pred = clu
浏览 6
提问于2018-07-13
得票数 4
回答已采纳
2
回答
从k均值聚类中去除异常值
、
、
、
、
我有许多较小的数据集,每个数据集包含10个XY坐标。我正在使用Matlab (R2012a)和k-means来获得质心。在一些聚类中(见下图),我可以看到一些极值点,因为我的数据集和它们一样小,一个大纲视图破坏了我的质心值。有没有一种简单的方法来表达这些观点?假设Matlab有一个“排除异常值”功能,但我在工具菜单中的任何地方都看不到它。谢谢你的帮助!(是的,我是个新手:-)
浏览 2
提问于2012-12-21
得票数 7
回答已采纳
1
回答
如何使用LDA/Bi聚类/K-mean进行时间聚类R?
、
、
、
、
我有一个这样的数据集,其中包含大约1000个乘客ID以及他们从周日到周六在时态1和时态12之间的旅行频率。是否可以使用bi聚类来对此数据集进行聚类?以及如何去做。 ID T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 Day 1005 0 5 15 1 0 1 20 2 1 1 0 0 Sunday 1005 0 2 1 0 4 1 21 1 0 0 0 0 Monday 1005 0 0 12 0 1 4 1 2 0 1
浏览 2
提问于2016-07-20
得票数 0
1
回答
不管聚类中心是如何初始化的,Kmeans算法都能保证收敛吗?为什么?
、
、
、
、
K-means是一种随机初始化聚类中心的迭代算法。不管聚类中心是如何初始化的,Kmeans算法都能保证收敛吗?为什么?
浏览 49
提问于2020-05-07
得票数 2
2
回答
如何使用Mahout Streaming K-Means
、
、
我已经看到在mahout中有一个新的K-Means实现,称为Streaming-Kmeans,它实现了没有链式Mapper-Reducer循环的k-means聚类: 我在任何地方都没有找到任何关于它的用法的文章。谁能指出它的用法有什么有用的链接,里面有一些关于如何使用它的代码示例。
浏览 2
提问于2013-06-24
得票数 3
1
回答
Spark K-means,点有自己的簇
、
、
我正在做一个项目,在这个项目中,我必须根据一些训练观察结果创建一个k-means模型。我有380个观察结果( 700个特征)。我正在使用Spark MlLib的K-means算法。当我选择大于10的k(聚类数)时,我的一些聚类只得到1分(例如,在25,其中6个聚类只得到1分)。首先,我认为一些点与其他点有很大的距离,但问题是并不总是有相同的点被分配到自己的簇中。 这是一种预期的行为吗?如果这是一个问题,它有多大?
浏览 1
提问于2017-05-15
得票数 0
4
回答
Scikit K-均值聚类性能度量
、
、
、
、
我试图用K均值方法进行聚类,但我想衡量一下集群的性能。 我不是专家,但我渴望了解更多关于聚类的知识。 这是我的代码: import pandas as pd from sklearn import datasets #loading the dataset iris = datasets.load_iris() df = pd.DataFrame(iris.data) #K-Means from sklearn import cluster k_means = cluster.KMeans(n_clusters=3) k_means.fit(df) #K-means training y_
浏览 12
提问于2017-05-04
得票数 17
1
回答
一种不需要预先定义簇数的聚类算法
、
、
我有一组来自搜索引擎的用户查询需要集群。到目前为止,我遇到的唯一的聚类算法是K-means算法,它需要定义聚类的数量。在这种情况下,我不知道数据中存在多少簇。是否有任何聚类算法允许在不预先定义聚类数量的情况下进行聚类?
浏览 0
提问于2013-01-29
得票数 0
3
回答
K-表示初始中心决定结果?
、
、
K-均值聚类是一种常用的聚类方法.假设K-均值聚类有N个点,即N个点应划分为K个群,其中每个组中的点具有相似性。 在K-means clustering处理之前,我们应该给初始中心赋值,在这里,我从所有的点中随机选择K点,程序每次运行都得到不同的输出。为什么这会导致不同的结果,我如何知道哪一个是最好的分类?
浏览 5
提问于2014-01-07
得票数 4
回答已采纳
2
回答
K-means算法的种子选择策略
、
、
、
我想知道哪种种子选择方法可以应用于K-means算法。谷歌搜索并没有那么有帮助。有什么建议吗?
浏览 3
提问于2011-10-09
得票数 2
回答已采纳
5
回答
一维数字数组聚类
、
、
、
、
假设我有一个这样的数组: [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法将数组划分成这样的东西? [[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题,但大多数人建议使用k-means聚类点,比如,对于像我这样的初学者来说,这是相当令人困惑的。另外,我认为k-means更适合于二维或更多维聚类,对吗?有没有办法根据数字将N个数字的数组划分为多个分区/集群? 有些人还建议严格的范围划分,但它并不总是呈现预期的结果
浏览 4
提问于2012-07-17
得票数 97
回答已采纳
1
回答
无tf-idf预处理的文本数据K-均值聚类
、
我使用k-means对文本数据进行聚类,没有经过TF-IDF预处理将文本数据转换为数字。我可以毫无问题地检索K-means聚类组,但据我所知,K-means不是只接受数字数据吗? 有人能给我解释一下,K-means是如何计算文本之间的距离的吗? 数据是一个有数千行的数据帧,下面是其中的一部分。“牛奶果酱面包苹果牛肉苏打”是我聚在一起的文字。"True“表示该项显示在第n个观察值中。 Milk Jam Bread Apple Beef Soda False True True False False False True True
浏览 5
提问于2018-11-25
得票数 0
4
回答
在Python scikit-learn中每次运行后聚类结果的变化
、
、
、
、
我有一堆句子,我想使用scikit-learn频谱聚类对它们进行聚类。我已经运行了代码并得到了没有问题的结果。但是,每次我运行它都会得到不同的结果。我知道这是印心的问题,但我不知道如何解决它。这是我在句子上运行的代码的一部分: vectorizer = TfidfVectorizer(norm='l2',sublinear_tf=True,tokenizer=tokenize,stop_words='english',charset_error="ignore",ngram_range=(1, 5),min_df=1) X = vectorize
浏览 1
提问于2014-09-19
得票数 18
1
回答
如何在k-means python中输入或确定聚类中心?
、
、
、
、
我对聚类方法有一些问题,那就是K-Means我想用经纬度坐标对一个新数据进行聚类。但在此之前,我已经使用现有数据自己设置了集群中心。有没有人能用python代码解释一下,如何将集群中心数据输入到kmeans方法中,而不需要对kmeans进行拟合?因为当现有的数据拟合到kmeans时,聚类的中心会发生变化,所以新的数据将基于从拟合结果中获得的新的聚类中心。 感谢您的关注
浏览 64
提问于2021-08-04
得票数 0
1
回答
如何评价文本聚类算法的性能?
、
、
、
我正在使用K-Means算法进行文本聚类,初始种子使用K-Means++。 我试图通过一些改变来提高算法的效率,比如改变停用词字典和增加max_no_of_random_iterations。 我得到了不同的结果。我如何比较它们呢?我不能在这里应用混淆矩阵的概念。输出不是某个文档获取某个值或标记的形式。一个文档转到一个集合。这只是相对的“良好的聚类”或集合的问题。 那么有没有一些标准的方法来标记这个输出集的性能呢? 如果混淆矩阵是答案,请解释如何做到这一点? 谢谢。
浏览 4
提问于2013-07-25
得票数 1
3
回答
自组织映射Vs k-means
、
有人知道自组织映射(SOM)与k-means相比有多好吗?我认为通常在颜色空间中,例如RGB,自组织映射是一种更好的颜色聚类方法,因为视觉上不同的颜色()在颜色空间中存在重叠。是否存在k-means优于SOM的情况? 谢谢!
浏览 0
提问于2011-07-07
得票数 6
回答已采纳
1
回答
长度归一化的应用是什么?
、
我找到了一些关于的信息。我发现它只在搜索引擎的上下文中提到。人们是否为了不同的文字目的而使用它?(请原谅我的无知。我确实搜索过它的其他用途,但是google一直把“正常化”和“缩放”混淆在一起。
浏览 2
提问于2014-01-29
得票数 1
回答已采纳
2
回答
电影类型的聚类
、
、
、
、
我是数据挖掘领域的初学者,我想将我的电影数据集聚类以找到流派组。我的数据集中有86部电影的26种不同类型。我想使用聚类来将我的电影分成几种类型,而不是26种。因此,例如,在运行某些聚类算法后,我将只剩下4个聚类或任何最适合我的数据集的小计数。我已经将我的数据集定义如下: M1 { G1,G2,.....G26} M2{G1,G2,.....G26}其中每个流派G1,...,G26可以保持值0或1,0表示缺席,1表示存在。现在我的下一步是在上面运行k-means聚类,我想使用一个很好的距离函数来表示皮尔逊相关系数。 我正在使用MATLAB做我的实验。我试着使用k=3,4,5,6做k-Means,
浏览 2
提问于2013-01-10
得票数 0
回答已采纳
2
回答
K-均值聚类-带有额外变量
、
、
、
我正在做一个k-means聚类,有固定数量的组,有几个地理经度/经度点。这个基本的集群工作得很好。 但我还有另一个变量(每个点一个),我希望k-means聚类能够说明这一点。这是不是有可能呢? 聚类数据可能如下所示: Lat: [1.23, 2.12, 3.65, 4.32, 5.63, 5.43] Lon: [1.43, 2.43, 3.76, 4.43, 5.25, 1.75] Extra variable: [20, 20, 10, 10, 10, 10] 如果我想把上面的数据分成两组,并且每组额外变量的总和不能超过40,我该怎么做呢?(如果可能的话-我对k-means的理解是相当基础的
浏览 0
提问于2019-09-18
得票数 0
6
回答
实现半监督(约束)集群的包有哪些?
、
、
、
我想在半监督(约束)聚类上运行一些实验,特别是使用作为实例级成对约束(必须链接或不能链接约束)提供的背景知识。我想知道有没有好的开源包可以实现半监督聚类?我尝试查看PyBrain、mlpy、scikit和orange,但我找不到任何受约束的聚类算法。特别是,我对约束K-Means或基于约束密度的聚类算法(如C-DBSCAN)感兴趣。最好使用Matlab、Python、Java或C++格式的包,但不限于这些语言。
浏览 2
提问于2014-01-21
得票数 9
1
回答
当记录和两个质心之间的欧几里德距离相同时,我应该将记录分配给哪个k-means集群?
、
我正在处理k-means聚类6条记录。我得到了质心和K=3。我只有两个特征。我给定的质心是已知的。由于我只有3个特征,我假设为x,y点,并且我已经绘制了它们。 将这些点映射到x和y轴上,找到我发现的欧几里德距离,假设(8,6)属于我的第一个簇。然而,对于所有其他记录,记录2个最近质心之间的欧几里德距离是相同的。那么假设点(2,6)应该属于质心(2,4)或(2,8)??或(5,4)属于(2,4)或(8,4)?? 感谢您的回复
浏览 14
提问于2016-08-11
得票数 0
1
回答
如何计算每个聚类的协方差矩阵,比如k-means?
、
我一直在到处寻找,我只找到了如何创建一个从一个向量到另一个向量的协方差矩阵,比如cov(xi,xj)。我困惑的一件事是,如何从集群中获得协方差矩阵。每个簇都有许多向量。如何将它们合并到一个协方差矩阵中。有什么建议吗? 信息: 输入:簇中的向量,Xi = ( x0,x1,...,xt),x0={5 1 2 3 4} -->一个列向量 (实际上它是一个MFCC特征向量,每个向量有12个系数,在用k-means聚类后,8个聚类,现在我想得到每个聚类的协方差矩阵,作为高斯混合模型中的协方差矩阵) output : covariance matrix n x n
浏览 4
提问于2011-05-30
得票数 3
回答已采纳
1
回答
基于聚类K的数据挖掘SSE
、
、
我正在使用K-Means和聚类处理WEKA。 通常,我在项目的数据集上检查不同的算法。 我不能决定我应该选择什么最佳SSE/集群比率。 从理论上讲,随着集群的增加,SSE会减少,但直到哪里呢? 发现了一些手指法则,K= (n/2)^0.5,有人能对此表示赞同吗?
浏览 0
提问于2013-04-23
得票数 0
回答已采纳
2
回答
为什么k-means聚类忽略了一个重要的数据补丁?
、
、
我正在使用一组坐标,并且希望动态地(我有许多组需要经历这个过程)了解数据中有多少不同的组。我的方法是应用k-means来调查它是否会找到质心,然后我可以从那里开始。 当绘制具有6个不同聚类的数据时(视觉上),k-means算法继续忽略两个重要的聚类,同时将许多质心放入另一个聚类中。 如下图所示: 红色是坐标数据点,蓝色是k-means提供的质心。在这个特定的例子中,我选择了15 (任意),但它仍然不能识别右手边的那些数据补丁,而是在它们之间放置一个中点,而在右上角的集群中放入8。 诚然,在右上角有稍微多一点的数据点,但并不多。 我在R中使用标准的k-means算法,只需输入x和y坐标
浏览 3
提问于2017-08-17
得票数 0
3
回答
功能缩放在scikit learn中的使用
、
、
、
我在这里学习机器学习,这门课使用的是regression 中的'scikit learning‘。 我可以看到,对于一些训练回归算法,作者使用了特征缩放,而对于某些回归算法,他没有使用特征缩放,因为一些“scikit学习”回归算法会自己处理特征缩放。 如何知道我们需要在哪种训练算法中进行特征缩放,以及我们不需要在哪里进行?
浏览 2
提问于2018-08-03
得票数 0
3
回答
如何在R中使用k-means聚类技术获得与数据对应的簇号?
、
、
我使用k-means聚类方法对数据进行聚类,如何在R中使用k-means聚类技术获得与数据对应的聚类数?以便获得每条记录属于哪个簇。 示例12 32 13 => 1. 12,13 2. 32
浏览 1
提问于2011-11-26
得票数 3
2
回答
我应该使用哪种集群技术?
、
我有一个数据矩阵,如下所示。 user access matrix..each行代表用户,每一列代表该用户访问的页面类别。 0 8 1 0 0 8 0 0 0 0 0 0 0 11 2 2 0 1 0 7 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 1 0 0 0 1
浏览 2
提问于2014-05-07
得票数 0
1
回答
如何在sklearn k-means聚类中将点数较大的组标记为“0”
、
在sklearn中使用K-means聚类方法时,我将点聚类成两组。如何将点编号较大的群的k_means.labels_设置为‘0’(而不是1)? 谢谢!
浏览 0
提问于2015-06-17
得票数 1
1
回答
当分类数据和数值数据混合时,如何在k-means中找到k?
、
、
、
、
我正在使用kmodes包中实现的称为k-prototype聚类的k-means变体,当存在分类数据和数字数据的混合时,它可以工作。 如何找到适用于此的集群数量?
浏览 1
提问于2016-06-14
得票数 0
2
回答
如何在sklearn库中使用k-means聚类中的轮廓得分?
、
、
、
、
我想在我的脚本中使用silhouette score,从sklearn中自动计算k-means聚类中的聚类数量。 import numpy as np import pandas as pd import csv from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score filename = "CSV_BIG.csv" # Read the CSV file with the Pandas lib. path_dir = ".\\" dataframe =
浏览 7
提问于2018-07-02
得票数 15
回答已采纳
2
回答
在c++中对二进制向量进行k均值聚类的快速方法
、
、
、
我想将二进制向量(数百万个)聚类到k个聚类中,我使用hamming距离来寻找与初始聚类最近的邻居(这也非常慢)。我认为K-means聚类并不真正适合这里。问题在于计算到某个初始聚类中心的最近邻居(二进制向量)的平均值,以更新质心。 第二种选择是使用K-medoid,其中新的集群中心是从最近的邻居之一(对于特定集群中心的所有邻居最近的一个)中选择的。但是发现这是另一个问题,因为最近的邻居的数量也相当大。 有没有人能给我带路?
浏览 2
提问于2013-06-11
得票数 4
回答已采纳
3
回答
谱聚类Scikit学习集群中的打印项
、
、
我知道我可以使用以下代码获取K-means集群中特定集群的内容,并使用scikit-learn。 order_centroids = model.cluster_centers_.argsort()[:, ::-1] terms = vectorizer.get_feature_names() for i in range(true_k): print "Cluster %d:" % i, for ind in order_centroids[i, :10]: print ' %s'
浏览 4
提问于2015-09-26
得票数 3
回答已采纳
3
回答
在java中使用k-means算法执行文档聚类的步骤
我需要在java中使用k-means算法执行文档聚类的步骤。这将是非常有用的,我提供的步骤很容易。提前谢谢。
浏览 3
提问于2010-08-18
得票数 5
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用K-means算法进行客户分类
使用 K-means 算法进行客户分类
K-Means实战精粹:从原理到应用
用Python进行无监督学习的几种最热门的聚类算法
无监督学习—聚类、层次聚类、t-SNE,DBSCAN
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券