腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
如何
从
rapidminer
中
的
聚
类
方法
计算
Davies
Bouldin
?
cluster-analysis
、
rapidminer
我想在没有k-means
的
情况下对数据进行
聚
类
。例如,我更喜欢使用DBSCAN或支持向量
聚
类
进行
聚
类
。因此,我需要使用
Davies
Bouldin
度量来评估
聚
类
的
性能,但我不知道
如何
在
Rapidminer
for DBSCAN或支持向量
聚
类
中
计算
Davies
Boul
浏览 10
提问于2017-06-09
得票数 0
回答已采纳
2
回答
自动确定聚
类
数k-means
cluster-analysis
、
data-mining
、
k-means
、
rapidminer
我想在rapid miner
中
建立一个集群模型,它可以自动定义集群
的
数量,然后继续使用k-means算法。在快速挖掘器中有没有自动确定聚
类
k
的
方法
?
浏览 0
提问于2014-11-09
得票数 1
1
回答
聚
类
性能评价(
Davies
指数)误差
python
、
scikit-learn
、
cluster-analysis
、
k-means
我试图使用不同
的
聚
类
性能评估
方法
来确定集群
的
最佳数量。我把我
的
数据通过循环运行DBA k-
方法
。我得到肘部和剪影
的
结果,但邓恩指数显示错误。以下是代码:silhouette = []clusters_range = range(1, 10)for K insilhouette.append(silhouette_score(scale
浏览 8
提问于2022-06-24
得票数 0
回答已采纳
1
回答
Sklearn k-均值
聚
类
(加权),确定每个特征
的
最佳样本权重?
machine-learning
、
scikit-learn
、
cluster-analysis
、
unsupervised-learning
、
feature-clustering
K-均值
聚
类
在学习
中
,簇数是预先已知
的
(它是2).有多种特征。特征值最初是不分配任何权重
的
,即它们被同等对待。然而,任务是为每个特性分配自定义权重,以获得最佳
的
聚
类
分离。
如何
确定每个特征
的
最优样本权重(sample_weight),从而得到两个
聚
类
之间
的
最佳分离?如果对于k均值或sklearn来说,这是不可能
的
,那么我对任何可选
的</em
浏览 6
提问于2021-01-05
得票数 0
1
回答
时间序列
聚
类
质量度量
clustering
、
time-series
、
unsupervised-learning
、
performance
我是
聚
类
时间序列数据集,这些数据集没有标签(没有根据事实),我想衡量集群
的
质量。你能不能建议一下可以用于时间序列
聚
类
的
聚
类
性能评估
方法
?
浏览 0
提问于2018-10-06
得票数 1
1
回答
在
聚
类
位置数据
的
情况下,寻找真正、真负等?
cluster-analysis
、
precision-recall
我一直在尝试评估一种
聚
类
技术。我知道F1评分是有效
的
方法
之一。在分类
的
情况下,我理解了它,但是由于没有这个
类
,我无法在这个例子
中
弄清楚。在我
的
场景
中
,我不可能有分类指标。由于我使用
的
是位置数据,所以我可以
从
形成
的
集群中找到以下可能
的
结果:Midpoint of the cluster 我可以
浏览 1
提问于2015-04-08
得票数 0
1
回答
基于Mahalanobis距离
的
距离矩阵
聚
类
cluster-analysis
、
distance
、
covariance
、
k-means
在我想要
聚
类
的
对象之间有一组成对距离(在矩阵
中
)。我目前使用k-均值
聚
类
(
计算
距离
从
质心到给定集群
的
所有成员
的
平均距离,因为我没有坐标),在一个区间内,k由最佳
Davies
-
Bouldin
索引选择。目前,我用欧几里德距离
计算
三个度量指标之间
的
距离矩阵,但我相当肯定,这些度量之间
的
差异正在搞砸它(例如,最大
的
度量
浏览 3
提问于2014-05-20
得票数 1
回答已采纳
1
回答
什么被认为是一个好
的
剪影得分?
python
、
k-means
我目前正在进行一些基于单词嵌入
的
聚
类
,并且我正在使用一些
方法
(肘部和doing )来确定我应该考虑
的
最佳集群数。此外,我还考虑了轮廓度。如果我正确理解了它,它就是测量数据与正确集群
的
正确匹配,范围
从
-1(不匹配)到1(正确匹配)。 使用kmeans
聚
类
,我得到了一个轮廓在0.5到0.55之间波动
的
分数。我添加了我所做
的
不同度量
的
图表,我用来生成它们
的
函数(在网上找
浏览 3
提问于2021-02-24
得票数 0
1
回答
R
中
的
输入k-均值
r
、
cluster-analysis
、
k-means
我正在尝试对一个69列1000行
的
数据帧执行k-means。首先,我需要首先使用
Davies
-
Bouldin
指数来确定最优
的
集群数量。这个算法要求输入应该是矩阵
的
形式,我首先使用了下面的代码:然后是以下代码(
Davies
-
Bouldin
索引)#
Davies
Bouldin
a
浏览 0
提问于2017-04-28
得票数 0
2
回答
如何
分析没有真实标签
的
聚
类
的
完整性?
python-3.x
、
machine-learning
、
scikit-learn
、
cluster-analysis
、
silhouette
我正在对数据进行
聚
类
(尝试多个算法),并试图评估每个算法产生
的
集群
的
一致性/完整性。我没有任何基本
的
真实标签,这排除了相当多
的
指标来分析性能。到目前为止,我一直在使用剪影得分以及calinski harabaz得分(
从
滑雪)。然而,有了这些分数,我才能比较
聚
类
的
完整性,如果我
从
算法中产生
的
标签建议至少有两个
聚
类
--但我
的</em
浏览 0
提问于2018-07-14
得票数 1
5
回答
我
的
python实现
的
Davies
指数正确吗?
python
、
statistics
、
cluster-analysis
、
metrics
、
data-science
我正在用Python
计算
。5步 <e
浏览 18
提问于2017-12-30
得票数 5
回答已采纳
1
回答
为什么戴维斯-博尔德选择了一个比剪影或卡林斯基哈拉巴斯更高
的
数字?
clustering
、
k-means
、
model-evaluations
我正在使用几个度量来知道有多少簇是正确
的
。为了做到这一点,我选择了3种
聚
类
算法和3种内部评估指标,剪影、Calinsky Harbasz和
Davies
Bouldin
。其结果如下:Kmean 3 3 9Gauss 3 3 10 最初
的
数据集有三个组,通常S和CH都很好,问题是DB总是为集群
的
数量返回一个高值吗?
浏览 0
提问于2020-07-26
得票数 1
回答已采纳
2
回答
rapidminer
中
的
召回率和精确度
cluster-analysis
、
rapidminer
、
precision-recall
在excel中有一个数据集,它在A列
中
包含一些标签(我称之为集群标签),在B列
中
包含一些属性(我称之为集群组件)。这些数据显示了最佳
的
聚
类
结果。但是我不知道
如何
在
rapidminer
中使用这些数据来
计算
其他
聚
类
方法
的
召回率和准确率! 有人能帮我吗?
浏览 0
提问于2011-05-05
得票数 0
1
回答
RapidMiner
中
具有动态时间翘曲
的
K-介质
cluster-analysis
、
rapidminer
如何
在
RapidMiner
中
利用动态时间翘曲作为距离度量来实现K-介质
聚
类
?The data contains missing values which is not allowed for KMediods
如何
对不同长度
的
时间序列进行
聚
类
?
浏览 2
提问于2015-01-12
得票数 1
回答已采纳
2
回答
rapidminer
和scikit-learn
中
的
DBSCAN算法
cluster-analysis
、
data-mining
、
scikit-learn
、
rapidminer
、
dbscan
我正在尝试寻找一种
聚
类
算法,用python对名义数据进行
聚
类
。为此,我在
RapidMiner
上尝试了DBSCAN算法,它处理
的
是名义数据。但是,当我用scikit-learn提供
的
DBSCAN算法尝试相同
的
数据集时,它给出了错误,即函数无法将字符串转换为浮点数。
rapidminer
和scikit
中
的
DBSCAN是否不同,我
如何
解决这个问题?另外,如果你告诉我另一种适用于名义数据<e
浏览 3
提问于2014-07-21
得票数 0
4
回答
如何
用Python
中
的
K-均值
聚
类
找到最优
聚
类
数
python
、
cluster-analysis
、
k-means
、
euclidean-distance
、
cosine-similarity
我对
聚
类
算法很陌生。我有一个有200多部电影和100多个用户
的
电影数据集。所有的用户至少给一部电影打分。如果注解器没有选择,值1表示好,0表示坏和空白。我想根据他们
的
评论对相似的用户进行
聚
类
,他们
的
想法是,将类似电影评为好
的
用户可能也会将同一组
中
没有被任何用户评为好
的
电影。我使用了k均值
聚
类
的
余弦相似性度量。user100 1 0
浏览 3
提问于2021-02-01
得票数 3
回答已采纳
1
回答
如何
评价tfidf和kmeans
的
结合
scikit-learn
、
machine-learning-model
、
k-means
、
tfidf
对于我
的
nlp问题,我使用了一个TF下手和KMeans
的
组合
从
学习包。tfidf获取向量,然后使用Kmeans对文本进行基于向量
的
聚
类
。我有一些类似于n_gram、输入特性和stop_words之类
的
TFIDF参数。问题是
如何
评估这个模型?我
的
猜测是,我不需要评估KMeans模型,因为它
的
作用只是
计算
点之间
的
距离,而我只需要专注于TFIDF模型和我最终使用
的
参数。
浏览 0
提问于2022-12-06
得票数 0
1
回答
Rapidminer
- k-means查询
rapidminer
很抱歉,如果这是一个非常新手
的
问题,但我最近开始探索
Rapidminer
。我已经使用它通过K-means
聚
类
对我
的
样本数据进行了
聚
类
。我
的
疑问是,如果我使用一个excel原始数据文件进行
聚
类
,我
如何
在excel文件
中
得到我
的
excel数据输出数据拆分成K个
聚
类
。我知道
如何
创建集群并在设计和结果屏幕之间切换。 提
浏览 3
提问于2016-01-29
得票数 0
8
回答
您使用哪些数据挖掘工具?
open-source
、
data-mining
除了两个著名
的
开源工具
RapidMiner
和Weka之外,您还可以推荐其他好
的
工具(开源或商业)来进行数据挖掘吗? 提前感谢!
浏览 5
提问于2009-08-12
得票数 6
1
回答
在TraMineR::seqdist
中
设置"tpow“和”费用“参数
r
、
cluster-analysis
、
traminer
、
sequence-analysis
我实际上正在研究住院病人住院期间
的
路径。这些路径被表示为状态序列(每个时间单元上的当前医疗单元),我试图通过
聚
类
算法找到典型
的
路径。我使用来自R包
的
seqdist函数TraMineR和
方法
"OMspell"来创建距离矩阵。我已经阅读了R文档和相关文章,但我找不到
如何
设置参数tpow和expcost。由于时间单位是一个小时,我不希望持续时间
的
任何微小差异对
聚
类
结果产生很大影响(例如,与医疗单元转移相
浏览 3
提问于2018-12-17
得票数 1
回答已采纳
点击加载更多
相关
资讯
在Python中如何在main函数中调用类中的方法
Python中如何在子类中不调用父类的__init__方法
如何在Excel中让文本公式计算的方法
孩子必备的计算机思维,如何从生活中培养?
周末AI课堂 聚类的几个重要问题 理论篇
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券