腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
R
聚类分析
沃德自动删除异常值
、
、
我如何在R中编码复制在SAS中进行的
聚类分析
,其中涉及method=Ward和TRIM=10选项,自动删除10%的情况作为异常值?(这个数据集有45个变量,每个变量都有一些异常值响应。)当我使用Ward的方法搜索R
聚类分析
时,trim选项被描述为缩短名称而不是删除异常值的东西。谢谢!
浏览 3
提问于2015-04-11
得票数 1
回答已采纳
1
回答
从
Python
中的1D和2D数据中识别出大量的异常值
、
、
、
、
问题:--尽管我以前从未做过
聚类分析
,但这个名字听起来好像可以实现我想要做的事情。如果我选择进行
聚类分析
,我想对以下两种情况进行分析: 我搜索了一下#1,使用KernelDensity模块更合适,而对于#2来说,使用MeahShift模块是一个很好的选择,无论是在
Python
中。问题:我以前从未做过
聚类分析
,所以我无法理解KernelDensity和MeahShift在它们的文档中给出的示例(分别是和 )。请有人解释一下,我如何使用KernelDensity和MeahShift来
浏览 4
提问于2015-07-09
得票数 1
回答已采纳
1
回答
在集群级别显示分层集群(没有
案例
)
、
、
、
我感兴趣的是可视化分层
聚类分析
的结果。是否可以使用树状图来显示集群(和子集群)的名称或标签,而不显示进入
聚类分析
的原始
案例
?提前谢谢你!
浏览 8
提问于2022-08-15
得票数 2
回答已采纳
2
回答
我应该使用多少变量来聚类一个巨大的数据集?
、
、
我的第一个问题是:我应该使用所有的量化变量来进行
聚类分析
吗?我阅读的所有手册都为集群解决方案选择了一些选定的变量,而不是所有这些变量。第二个问题是,我试图对所有的定量数据使用分层聚类,但SPSS通知说: 没有足够的有效
案例
来执行
聚类分析
。...which意味着我拥有的数据集不能用来进行
聚类分析
.在这种情况下,我应该做什么来执行
聚类分析
?
浏览 9
提问于2016-11-15
得票数 0
1
回答
转置在SPSS中的应用
、
、
有没有什么针对SPSS的
Python
脚本或者其他自动化这个过程的技巧?
浏览 2
提问于2012-11-06
得票数 1
回答已采纳
1
回答
在
python
中对地理编码/(经度/经度)数据点进行
聚类分析
的最佳方法是什么?
、
、
、
在
python
中对地理编码/(经度/经度)数据点进行
聚类分析
的最佳方法是什么?这方面的任何帮助都将不胜感激。 谢谢
浏览 2
提问于2016-01-27
得票数 1
1
回答
如何在Jupyter上从你的计算机中加载一个文件夹(包含文本文件),以便能够对它们一起运行分析?
、
、
、
、
我正试图从WINDOWS计算机的桌面上加载我的Jupyter笔记本(
Python
3)上的一个文件夹(包含大约1000个.txt文件),以便我可以继续进行与NLP相关的分析。/text folder sample') 下一代(Gen) 我正在寻求您的帮助与代码行,这将使我的
python
脚本加载,并继续分析文件。**每个.txt文件都是一个自传,所以我试图将它们作为一个独立的
案例
来对待,以便在以后的阶段可以推断出哪些自传是相似的(例如,
聚类分析
)。
浏览 18
提问于2019-04-27
得票数 0
1
回答
只包含范畴变量的大型数据集的
聚类分析
、
、
我尝试用MCA (多重对应算法)减少数据的维数,然后使用k均值和dbscan进行
聚类分析
,但结果并不令人满意。 有哪些合适的算法用于高维大型数据集的
聚类分析
及其
python
实现?
浏览 1
提问于2019-05-30
得票数 0
回答已采纳
1
回答
使用mclust结果来预测R之外集群成员资格
我已经使用R中的Mclust执行了潜在的类
聚类分析
。现在,我想使用结果来预测不在我过去训练的数据集中的人的聚类成员。我知道预测函数,但这不是我要找的。faithful)Mclust在预测函数中使用了一个公式,我想要获得这个公式,以便预测数据集中不存在的
案例
(我每天都会收到新的
案例
,所以不能使用预测函数)。
浏览 1
提问于2014-06-25
得票数 2
3
回答
从
Python
3.1.1到R的最佳接口是什么?
、
、
、
我在MacOSX10.6.2上使用
Python
3.1.1,需要一个R的接口。当我浏览互联网时,我发现了RPy。这是正确的选择吗? 目前,
Python
中的程序计算距离矩阵并将其存储在文件中。我以交互的方式单独调用R,并读取用于
聚类分析
的矩阵。为了简化计算,可以为R准备一个脚本文件,然后从
Python
中调用它并读取结果。因为我是
Python
的新手,所以我不想回到2.6。
浏览 2
提问于2010-04-04
得票数 12
回答已采纳
2
回答
python
中二进制数据距离矩阵的计算
、
、
、
我正在
python
中执行分层
聚类分析
。我的变量是二进制的,所以我想知道如何计算二元欧几里德距离。根据文献,利用这种聚类技术可以使用这种距离度量。有没有基于二元欧氏距离度量计算距离矩阵的
python
库?
浏览 0
提问于2018-08-16
得票数 2
1
回答
如何求R中距离矩阵的最小值?我的方法不管用。
我想在我的距离矩阵中找到最小值,以便用R编写用于
聚类分析
的单链算法,但输出没有显示坐标(行号和列号)来识别最小值。> which(x == min(x), arr.ind=TRUE)[1,] 1 2 我用我的
案例
进行了尝试
浏览 0
提问于2019-10-23
得票数 0
3
回答
Python
中最快的集群包是什么?
、
、
、
、
我想对1,300列和500,000行的数据集进行
聚类分析
。SciKit-学习慢吗?如果是的话,
Python
中最好的(最快的)集群包是什么?
浏览 0
提问于2023-03-07
得票数 1
回答已采纳
2
回答
如何在
python
中利用层次
聚类分析
自动求出最优聚类数?
、
、
我想利用层次
聚类分析
自动得到聚类的最优个数(K),然后将该K应用于K-均值聚类中。在研究了很多文章之后,我知道一些方法告诉我们,我们可以绘制图来确定K,但是有什么方法可以在
python
中自动输出一个实数呢?
浏览 4
提问于2018-06-05
得票数 5
1
回答
由分类数据和连续数据组成的数据集的
聚类分析
?
、
我一生中从来没有做过
聚类分析
,我整齐地遵循了一本关于如何在R中进行
聚类分析
的书中的步骤。R:无监督机器学习的
聚类分析
实用指南:第1卷(多元分析),Alboukadel Kassambara先生 然而,我遇到了一个问题,因为在这本书中,数据标准化取代了数值变量,然而,我有一个由13个变量组成的数据集我查过google和一些堆叠溢出问题,我找不到一个明确的答案,比如如何处理分类变量和连续变量组合的
聚类分析
。
浏览 2
提问于2018-07-18
得票数 0
回答已采纳
1
回答
聚类客户群购买行为
我有一组数据,我想知道它们是否有必要添加到
聚类分析
中。与ONEOFF_PURCHASES_FREQUENCY一样,我不确定它是否有助于进行
聚类分析
。
浏览 0
提问于2022-10-04
得票数 0
2
回答
在日历中显示群集
、
、
我正在进行分层
聚类分析
。第一列(chr)是日期,不包括在
聚类分析
中。 有办法在日历上显示星系团吗?我有日期列和集群列。
浏览 2
提问于2022-04-08
得票数 0
1
回答
在
Python
编程中使用numpy和nltk或CLUTO对单词进行聚类
、
、
、
我正在尝试对一些单词进行聚类。 cat dog horse ostrich dog 7 8 3 2.4ostrich 3.4 3.2 4.4 8一开始,我试着用CLUTO...制作一些簇和一个(非常漂亮的)图,如下所示。 但是我不能..。我已经看过手册了,但它并不那么容易理解。因此,我尝试使用nltk中的一些
浏览 3
提问于2013-12-26
得票数 1
1
回答
使用Scipy进行按列或按行的层次聚类
、
、
我正在使用
python
Scipy对数据帧进行分层
聚类分析
,我想知道聚类是面向列的还是面向行的?我会得到不同的结果,这取决于我在计算距离矩阵之前是否转置了数据帧。
浏览 2
提问于2020-09-29
得票数 0
1
回答
在分类数据的记录中查找异常
、
、
、
我有一个数据集,其中有m个观察值和p个分类变量(标称),每个变量X1,X2...Xp都有几个不同的类(可能的值)。最终,我正在寻找一种发现异常的方法,即根据我到目前为止看到的数据,识别那些值组合似乎不正确的行。到目前为止,我正在考虑构建一个模型来预测每列的值,然后构建一些度量来评估实际行与预测行的不同程度。如果有任何帮助,我将不胜感激!
浏览 12
提问于2018-02-27
得票数 0
点击加载更多
相关
资讯
聚类分析及python实现(二)
聚类分析及python实现(一)
聚类分析及Python分析(三)
机器学习聚类分析——k-means文本聚类分析
聚类分析(一)
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券