文章/答案/技术大牛

发布

社区首页 >问答首页 >每个K均值聚类中的数据数量是多少

问每个K均值聚类中的数据数量是多少
EN

Stack Overflow用户

提问于 2019-09-12 07:44:51

回答 2查看 106关注 0票数 0

我已经写了一段代码，它将根据silhouette_score的最大值给出最佳的集群数量。现在我想找出每个集群有多少个值。例如，我的结果是最佳聚类数是3，我想找出每个聚类有多少值，例如第一个聚类有1241个值，第二个是3134个值，第三个是351个值。有没有可能做这样的事情？

import pandas as pd
import matplotlib.pyplot as plt
import re 
from sklearn.preprocessing import scale

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer, TfidfTransformer
from sklearn.cluster import KMeans, MiniBatchKMeans, AffinityPropagation

from sklearn.metrics import silhouette_samples, silhouette_score
from sklearn.metrics.cluster import adjusted_mutual_info_score

from sklearn.decomposition import PCA

df = pd.read_csv('CNN Comments.csv')
df = df.head(8000)
#print(df)
x = df['Text Data']

cv = TfidfVectorizer(analyzer = 'word',max_features = 10000, preprocessor=None, lowercase=True, tokenizer=None, stop_words = 'english')
#cv = CountVectorizer(analyzer = 'word', max_features = 8000, preprocessor=None, lowercase=True, tokenizer=None, stop_words = 'english')  

x = cv.fit_transform(x)

my_list = []
list_of_clusters = []
for i in range(2,5):

    kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42)
    kmeans.fit(x)
    my_list.append(kmeans.inertia_)

    cluster_labels = kmeans.fit_predict(x)

    silhouette_avg = silhouette_score(x, cluster_labels) * 100
    print(round(silhouette_avg,2))
    list_of_clusters.append(round(silhouette_avg, 1))


plt.plot(range(2,5),my_list)
plt.show()


number_of_clusters = max(list_of_clusters)
number_of_clusters = list_of_clusters.index(number_of_clusters)+2

print('Number of clusters: ', number_of_clusters)

python

scikit-learn

cluster-analysis

k-means

回答 2

Stack Overflow用户

发布于 2019-09-12 07:58:32

您可以使用分配给cluster_labels的数组来获取集群分配的分布。我推荐使用集合模块中的Counter。

from collections import Counter

...

cluster_labels = kmeans.fit_predict(x)
cluster_counts = Counter(cluster_labels)

票数 2

Stack Overflow用户

发布于 2019-09-13 06:12:31

numpy的alternativ：

import numpy as np
...
unique, counts = np.unique(kmeans.fit_predict(x), return_counts=True)
print(dict(zip(unique, counts)))

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57901993

复制

C#-VsCode如何运行C#代码

.net sdk ide

VsCode作为一款优秀的代码编辑器，有调试代码的功能，我们必须要来玩一玩这个，这里就以运行c#代码为例子，简单的说一下吧。

kdyonly

2023/03/03

2.2K0

html语言代码超链接,html 超链接 word html超链接代码

html

“打开/保存”是因浏览者的浏览器而异的，假如浏览者的电脑没有装word软件，那么，无论什么情况，都是打不开的，你只能选择保存(选择打开的话，电脑会让你选择使用什么软件来打开)；如果浏览者的电脑装了word软件，那么如果电脑的安全级别高一些，一样会提示“打开/保存”，为的是防止直接打开病毒文件。

全栈程序员站长

2022/09/14

21.2K0

如何让软件以 System 权限运行

https 网络安全

本文只是告诉大家调试 System 运行软件时可以如何快速让一个应用以 System 权限运行。使用 PsExec 可以让软件以 System 账户运行

林德熙

2020/02/18

2.7K0

html中超链接使用_HTML超链接代码

java https 网络安全 html

html超链接的写法是e69da5e6ba903231313335323631343130323136353331333431353431使用a标签，如：百度一下，你就知道。

全栈程序员站长

2022/09/18

1.3K0

Outlook如何备份邮件

腾讯云测试服务

点击outlook菜单栏上的“文件”选项，可以看到主界面右侧有一个“添加账户”的选项。

周小董

2019/03/25

4.1K0

C#字符串截取

编程算法

常用字符串截取 string str="123abc456"; int i=3; 1 取字符串的前i个字符 str=str.Substring(0,i); // or str=str.Remove(i,str.Length-i); 2 去掉字符串的前i个字符： str=str.Remove(0,i); // or str=str.Substring(i); 3 从右边开始取i个字符： str=str.Substring(str.Length-i); // or str=str.Remove(0,st

yaphetsfang

2020/07/30

2.3K0

按钮式超链接代码

java https 网络安全 html

其中，鼠标经过超链接的时候设置的样式。padding属性意在通过内边距微调来改变文字位置

全栈程序员站长

2022/09/18

1.4K0

HTML超链接使用代码

html css java https 网络安全

HTML 超链接（链接） HTML使用标签来设置超文本链接。在标签中使用了href属性来描述链接的地址。超链接可以是一个字，一个词，或者一组词，也可以是一幅图像，您可以点击这些内容来跳转到新的文档或者当前文档中的某个部分。当您把鼠标指针移动到网页中的某个链接上时，箭头会变为一只小手。

全栈程序员站长

2022/09/14

2.4K0

如何运行ruby代码

ruby

第一种，ruby -e 在命令行中运行下面命令，-e的意思是，把后面的字符串当作脚本执行 ruby -e "print 'hello'" 使用irb交互控制台在命令行输入irb hello worldxingoo@xingoo-Lenovo:~/workspace/RubyTest$ irb irb(main):001:0> p "hello" "hello" => "hello" irb(main):002:0> p "中文hello" "中文hello" => "中文hello" irb(main):

用户1154259

2018/01/17

1.4K0

如何运行PHP代码_运行php网站

php https http 网络安全

相信不少初学者会遇到不知道如何运行php这个尴尬的问题，小白博主就来一次比较详细的介绍

全栈程序员站长

2022/11/11

10.3K0

pycharm如何执行代码_pycharm如何运行代码

java https 网络安全 ide

首先在pycharm 中的python 文件，比如：test.py，右键点击 show in explore,会弹出test.py的所在的文件夹，如图所示：

全栈程序员站长

2022/09/27

1.2K0

【改进和增强Microsoft Office应用程序】ExtendOffice软件产品介绍

windows server

ExtendOffice Technology Inc.成立于2008年，是一家提供专业Microsoft Office加载项的主要公司。早在2004年，该公司的创始人就启动了Addintools.com来销售Microsoft Office的加载项。

51Component

2022/11/09

11.4K0

【改进和增强Microsoft Office应用程序】ExtendOffice软件产品介绍

C# 字节数组截取

java https 网络安全

C# 字节数组截取如： byte[] bt = new byte[] { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }; 方法一截取位数规则 1）截取2位长度的字节数组用BitConverter.ToInt16 例如，从第2位开始截取2个字节则 BitConverter.ToInt16(bt,2)；

全栈程序员站长

2022/08/12

3.6K0

图片中加入超链接html代码,html网页超链接代码怎样用HTML代码在图片插入超链接…

html java https 网络安全

HTML使用定义锚创造链接，可用于文本，图片，HTML元素…… 一，将文本作为超链接文本二，将图像作为超链接三，将书签作为超链接 (在网页上显示的)书签文本 ① 在同文档中创建指向该锚的链接。文本 ② 在其他页面创建指向该锚的链接。

全栈程序员站长

2022/09/18

5.3K0

图片中加入超链接html代码,html网页超链接代码怎样用HTML代码在图片插入超链接…

（3）apache的安装，配置Apache以运行PHP代码

php apache

配置apache.以运行PHP程序将刚才的网页1base.php放到Apache的htdocs文件中，并通过浏览器“浏览”

孙寅

2020/06/02

2.1K0

如何在 Linux 中以脚本模式运行 Top

linux 脚本内存内核排序

在 Centos8 中，我们执行本文中的命令。下面命令按照 CPU 使用率对数据进行排序，并打印命令中指定的前 20 行。

用户9236362

2021/11/30

2.5K0

删除或关闭Word中的超链接

windows server

最近使用的word老是会把一些文字内容或者标题转换成乱七八糟的格式，看的莫名其妙的，找了好久也不知道什么问题，后来一查才知道是因为这些文字包含超链接，word自动转换了。。。你说是不是莫名其妙。

marsggbo

2019/05/26

2.6K0

SplitContainer(拆分条控件)

java https 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/161095.html原文链接：https://javaforall.cn

全栈程序员站长

2022/09/09

2.3K0

C#截取指定字符串函数

其他

本文转载：http://www.cnblogs.com/liufei88866/archive/2012/05/12/2497395.html

跟着阿笨一起玩NET

2018/09/19

1.2K0

c语言数组截取,C# 字符串按数组截取方法（C/S）

javascript 编程算法 https java 网络安全

private void button1_Click(object sender, EventArgs e) {

全栈程序员站长

2022/06/30

2.2K0

相似问题

如何在单击超链接时运行php代码

C#陷阱单击带有阅读窗格的Outlook (超链接)

Outlook邮件-禁止在超链接上单击鼠标左键或阻止Outlook跟随单击的超链接

如何使用Outlook AddIn插入可单击的超链接？

Visual 2015 Outlook AddIn + Office 365单击以运行

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问每个K均值聚类中的数据数量是多少
EN

回答 2

Stack Overflow用户

Stack Overflow用户

如何在单击超链接时运行php代码

C#陷阱单击带有阅读窗格的Outlook (超链接)

Outlook邮件-禁止在超链接上单击鼠标左键或阻止Outlook跟随单击的超链接

如何使用Outlook AddIn插入可单击的超链接？

Visual 2015 Outlook AddIn + Office 365单击以运行

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问每个K均值聚类中的数据数量是多少EN

回答 2

Stack Overflow用户

Stack Overflow用户

如何在单击超链接时运行php代码

C#陷阱单击带有阅读窗格的Outlook (超链接)

Outlook邮件-禁止在超链接上单击鼠标左键或阻止Outlook跟随单击的超链接

如何使用Outlook AddIn插入可单击的超链接？

Visual 2015 Outlook AddIn + Office 365单击以运行

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问每个K均值聚类中的数据数量是多少
EN