腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
层次
聚
类
-
查找
每个
组
中
的
观察
值
、
我有超过10个协变量
的
海量数据。目前,我使用
的
是分层
聚
类
。在树状图上,我看不清标签,因为有太多了。 --有没有办法找出哪些
观察
结果属于哪个
组
? (我使用
的
是R)
浏览 29
提问于2020-04-19
得票数 0
1
回答
在机器学习任务中使用
聚
类
来执行特征工程
的
直觉是什么?
、
、
、
我正在尝试实现研究论文增强树与元结构工程相结合
的
预测维护。本文有一个叫做元特征工程
的
部分,他们使用
层次
聚
类
来创建特征。报纸上说: 第三种分析数据集中异常值
的
方法是基于
层次
聚集聚
类
算法5。分层
聚
类
从Z
组
开始(Z是
观察
的
数目),
每个
组
最初包含一个对象,然后在
每个
步骤
中
合并两个最相似的
组</
浏览 0
提问于2021-03-23
得票数 1
回答已采纳
1
回答
层次
聚
类
中
寻找
聚
类
中心
的
Matlab代码
、
我正在尝试寻找
层次
聚
类
中
的
聚
类
中心。下面是我使用
的
代码。但这只返回
每个
观察
值
的
簇号。
浏览 2
提问于2014-10-11
得票数 0
2
回答
使用k均值和绘制距离矩阵时结果不一致。为什么?
我正在R Studio
中
做一些数据
的
聚
类
。我对K-means聚类分析和绘制
层次
聚
类
的
结果有问题。所以当我使用kmeans函数时,我得到了4
组
10,20,30和6个
观察
值
。然而,当我绘制树状图时,我得到了4
组
,但有不同数量
的
观察
: 23,26,10和7。mydata&
浏览 1
提问于2016-03-14
得票数 0
1
回答
理解pdist与mdscale
的
结合使用
、
、
、
每个
观察
用三个特征来描述。我必须将这些
观察
分为两
组
(我有
每个
观察
的
标签)。 在对观测数据进行
聚
类
之前,我首先计算了观测
值
之间
的
pdist,然后使用MATLAB
中
的
mdscale函数返回到三维。我使用transformed_observation作为k均值
聚
类
算法
的
输入,与使用原始观测
值
相比,获
浏览 1
提问于2016-01-26
得票数 0
回答已采纳
1
回答
获取集群
层次
结构和嵌套集群分配
、
、
、
、
我目前正在研究文档主题中
的
层次
结构。作为第一步,我找到我
的
文档
的
向量表示,然后我使用
层次
聚
类
来确定文档
的
主题中是否有主题。我只想考虑至少包含2%原始数据
的
(嵌套)集群。为了实现这一点,我使用R。现在,我正在努力从
聚
类
结果中有效地提取
聚
类
层次
结构。集群是通过"fastcluster“包完成
的
,它提供了与原始"h
浏览 1
提问于2017-05-08
得票数 0
1
回答
如何在
层次
结构
聚
类
中跟踪特定项目
、
、
、
我有一个与
层次
结构
聚
类
相关
的
问题。我有一个相对复杂
的
数据集,有2000个项目/样本。我使用scipy对项目进行
聚
类
,并给
聚
类
不同
的
分界
值
,例如,从0.1到0.9Z=hac.linkage(distance, single,'euclidean') results=hac.fclust
浏览 3
提问于2014-11-11
得票数 2
1
回答
增量
聚
类
算法
、
、
、
我正在寻找一种增量
聚
类
算法。所谓增量,我指的是从初始数据集开始构建集群
的
算法,它能够逐步吸收新
的
项/
观察
,将它们添加到现有的或新
的
集群
中
。
聚
类
的
最大数目是先验未知
的
,预计会随着时间
的
推移而增长,这意味着,在算法在初始数据集上运行之后,我期望收到属于以前从未见过
的
簇
的
观测结果。我对这类问题非常陌生,而
聚
类</em
浏览 0
提问于2022-12-02
得票数 2
1
回答
集群
的
典型实例--分层集群
、
、
、
我正在使用凝聚
层次
聚
类
方法对一
组
数据进行
聚
类
。其中我用于clusrting
的
数据集是轨迹。我使用一个自定义
的
距离函数来估计轨迹之间
的
距离。matlab代码如下:Z= linkage(ID,'single','@my_distfun');如何找到
每个
集群
的<
浏览 0
提问于2015-11-16
得票数 1
2
回答
在k-means
聚
类
中
,如何设置
每个
簇
的
最小
观察
值
?
、
、
、
、
我正在尝试根据用户
的
行为对一些产品进行
聚
类
。我最后得到
的
是具有非常不同数量
的
观察
值
的
星系团。 我已经检查了k-means
聚
类
参数,但无法找到控制
每个
聚
类
的
最小(或最大)
观察
值
数量
的
参数。例如,这里是如何在不同
的
集群中分布
观察
值
的</
浏览 59
提问于2019-05-01
得票数 4
1
回答
绘制表示时间序列
的
观察
值
的
聚
类
、
、
我正在使用dtwclust软件包对包含多变量时间序列数据
的
数据帧进行
聚
类
。在对这些数据进行
聚
类
后,我想根据
聚
类
,而不是时间序列数据,生成一个图表来呈现$k$
组
中
的
观察
结果!我想要一
组
观察
结果。我试图以dtw_cluster2$cluster
的
形式从tsclust()中提取集群,但是我得到了一个错误
的
"$ operato
浏览 0
提问于2020-11-08
得票数 1
1
回答
如何将使用k-medoids算法
的
聚
类
解决方案(例如PAM)应用于另一个数据集?
我正在寻找一种方法,将k- medoids算法(我正在使用PAM)
中
的
聚
类
解决方案从一个样本应用到另一个样本。我认为k-means算法可以做到这一点:对于data1,从
聚
类
结果
中
获得质心;然后在data2
中
,对于
每个
观察
值
,计算到
每个
质心
的
距离,然后将
每个
观察
值
分配到其最近
的
质心。然而,k-
浏览 30
提问于2020-02-12
得票数 2
回答已采纳
2
回答
在
聚
类
时,如何处理
每个
特性
中
的
零行?
、
、
、
、
我正在研究一个
聚
类
问题,它有13000个
观察
和15个特性。数据集中
的
大约3000个观测在
每个
特性中都是零
的
(即3000行
中
的
所有
值
都为零)。我正试图在此基础上进行
聚
类
。有什么更好
的
方法来处理它呢?我脑子里没有几件事,但我想弄清楚:在
每个
特性
中
包含零
值
行,并让
聚
浏览 0
提问于2020-01-22
得票数 2
回答已采纳
2
回答
在
每个
集群中使用特定数量
的
数据
的
分层
聚
类
、
、
我正在使用“
层次
聚
类
”对一
组
单词进行
聚
类
。我希望
每个
集群包含一定数量
的
单词,例如2个单词或3个单词。我也将max(d)
的
值
设为Inf。),] <- Inf Lm[min(d),] <- Inf } 然而,它没有给我预期
的</e
浏览 1
提问于2019-08-15
得票数 0
1
回答
如何利用现有的K-means模型对新数据进行分割?
、
、
我已经使用k-means
聚
类
建立了一个分割模型。目前,我正在应用与构建模型时相同
的
转换/标准化/异常值,然后计算欧几里德距离。最小距离是记录落入
的
区段。谢谢
浏览 0
提问于2013-08-09
得票数 2
1
回答
在R中使用hclust进行加权观测频率
聚
类
、
、
、
我有一个包含500K
观察
值
的
大型矩阵,需要使用分层
聚
类
进行
聚
类
。由于大小,我没有计算距离矩阵
的
计算能力。为了克服这个问题,我选择聚合我
的
矩阵来合并那些相同
的
观察
值
,从而将我
的
矩阵减少到大约10K个
观察
值
。我有这个聚合矩阵
中
每一行
的
频率。我现在需要将此频率作为权重合并到我
的
分层
浏览 15
提问于2017-07-25
得票数 1
1
回答
在DBLP数据集中
查找
聚
类
数
我正在尝试使用研究领域来
查找
DBLP V11数据集中
的
聚
类
数。我已经尝试使用doc2vec预训练和word2vec预训练平均,并使用DBSCAN、
层次
聚
类
对结果进行
聚
类
,并使用肘部方法、轮廓方法和差距统计获得
聚
类
的
数量。我从这里得到一个或两个集群,因为所有的文章都与计算机科学相关,但我需要找出计算机科学
中
的
子领域
的
数量。
浏览 16
提问于2019-05-22
得票数 0
1
回答
我能把
聚
类
算法应用于流形可视化方法
的
结果吗?
、
、
、
、
我明白,当具体提到“可视化”时,意味着非线性维数约简可以很好地洞察其低维投影
中
的
数据,但最常见
的
是,这种低维投影不能用于机器学习算法,因为高维结构
的
一些信息丢失了(粗略)。然而,这里
的
问题是,如果在可视化中
观察
到“集群”,那么将
聚
类
算法应用于低维转换数据并分别分析集群或
组
是可以接受
的
吗?例如,我将T应用于相当高维度
的
数据(40个特性),并获得以下表示:不考虑图片中
观察
到<em
浏览 0
提问于2016-03-31
得票数 4
1
回答
相似度矩阵
的
聚
类
技术
、
、
我有128个受访者
的
二进制数据,基于他们所选择
的
数码相机
的
功能。其中'1‘代表特征
的
选择,而'0’代表未选择
的
特征。我在列中有92个产品特性,在行中有响应者。
每个
响应者从92个特征集中恰好选择了20个特征。我想根据他们选择
的
功能创建不同用户
组
的
集群。我在这些二进制数据上尝试了一些
聚
类
算法,比如模糊
聚
类
和
层次
聚
浏览 5
提问于2017-03-07
得票数 0
1
回答
有没有一种方法可以在热图中保留
聚
类
,同时减少
观察
值
的
数量?
、
、
、
我有跨20列
的
90个
观察
值
(行)
的
数据集。我已经生成了一个非常整洁
的
热图,它使用pheatmap包将我
的
数据分成两
组
。虽然它不是完全干净
的
,但根据我
的
情况,这两个树状图很大程度上将我
的
样本分为两个不同
的
组
。现在,我想要将这90个集合减少到一个更严格
的
集合,大约20-30个
观察
点,但仍然希望保留与pheatmap中所示
的
相同<em
浏览 0
提问于2017-05-05
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
计算机如何感知大数据——聚类算法
使用Python实现无监督学习
40个问题测试你的机器学习聚类技术
5种主要聚类算法的简单介绍
在 FIFA 20 将技能相似球员进行分组(2):层次聚类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券