腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
6
回答
实现半监督(约束)集群的包有哪些?
、
、
、
我想在半监督(约束)
聚
类
上运行一些实验,特别是使用作为实例级成对约束(必须链接或不能链接约束)提供的背景知识。我想知道有没有好的开源包可以实现半监督
聚
类
?我尝试查看PyBrain、mlpy、scikit和orange,但我找不到任何受约束的
聚
类
算法。特别是,我对约束K-Means或基于约束
密度
的
聚
类
算法(如C-DBSCAN)感兴趣。最好使用Matlab、
Python
、Java或C++格式的包,但不限于这些语言。
浏览 2
提问于2014-01-21
得票数 9
2
回答
对已经聚集的数据进行分组(使用预定义的x和y)
、
、
就像只使用
聚
类
算法的分组部分一样,我一直在尝试使用阈值,但是在不会形成循环集群的情况下,它不会产生好的结果。 📷
浏览 0
提问于2019-02-11
得票数 3
1
回答
不同聚
类
算法对时间序列事件的
聚
类
、
、
、
input file so that it only contains rows that have all lower case letters还有一些其他的
聚
类
算法可能更适合我的情况。
浏览 1
提问于2015-02-03
得票数 2
回答已采纳
1
回答
以行作为输入提供的DBSCAN
、
、
、
我对机器学习和
python
都是新手,我的目标是尝试通过
聚
类
进行路由预测。 我刚刚开始使用,在输入到过程的坐标数组的情况下,我能够获得结果,例如[1,1,2,2,3,3,...]
浏览 1
提问于2018-09-06
得票数 0
1
回答
二维数据的
聚
类
方法,该方法能够自动检测簇数并处理异常值。
、
、
假设我有类似的数据:我正在寻找一种能够执行
聚
类
的方法或算法(例如,如图中所示),该方法或算法可以自动确定簇的最佳数目,同时也考虑到离群值。最好是在
Python
中对方法或相关实现/库/管道提出建议。
浏览 0
提问于2021-04-30
得票数 0
1
回答
基于动作顺序和时间顺序的用户
聚
类
/分类
、
、
、
我想要创建一个模型,它将根据这些模式和在每个地方花费的时间对这些用户进行
聚
类
/分类。另外,我已经有了这些模式的标签,这样我就可以进行分类和
聚
类
。我最初想对这些模式进行kmeans集群,但是引入在每个地方停留的时间会给
聚
类
带来混乱。我目前使用的是随机森林分类器,但结果并不是很有希望。
浏览 0
提问于2018-05-18
得票数 1
1
回答
基于
密度
的集群,允许用户指定集群数量
、
、
我正在寻找一种算法,可以根据
密度
对这些点进行
聚
类
,但我想指定聚
类
的数量。 我最初尝试了K-Means,因为这将允许我指定聚
类
的数量。然而,我的数据自然地“聚集”成脊状。本质上,我试图寻找的是一种算法,该算法将基于
密度
将图最佳地
聚
类
为N组。其中N由我提供。在这一点上,我并不关心它是在哪里实现的(R,
Python
,FORTRAN...)。
浏览 24
提问于2020-09-16
得票数 0
回答已采纳
2
回答
如何在集群上应用集群?
、
、
、
我使用R library(igraph)对我的数据集进行
聚
类
。我有几个连接的组件,但第一个非常大,这是巨大的组件。我想在这个巨大的组件上重新应用集群,以便重新构建集群。这样做有意义吗?
浏览 4
提问于2019-06-06
得票数 0
2
回答
Python
中点云(XYZ)点之间的最小距离
、
、
我试图在点云数据集上运行基于
密度
的空间
聚
类
(DBSCAN),它是具有x、y、z坐标的一系列点。最小距离参数之一。如何在
Python
中找到空间中一个点与另一个点之间的最小距离?非常感谢!
浏览 5
提问于2021-08-26
得票数 1
回答已采纳
2
回答
如何实现从分类到
聚
类
的飞跃
、
我有一个似乎无法解决的
聚
类
问题,尽管如果我把它作为一个标记分类问题来处理,我可以以令人满意的精度解决它。是否有一种优雅的方法来实现从能够解决分类问题到能够解决集群问题的飞跃?真实世界的数据肯定不只是由这两个
类
组成,它将由K个未知
类
组成,我希望它们能够以令人满意的精度进行
聚
类
。 那么,假设如果能够解决高精度的分类问题,就可以解决高精度的
聚
类
问题,这是否合乎逻辑?这是否意味着,我的特征提取,这是很好的分类工作,将良好的
聚
类</em
浏览 0
提问于2013-12-16
得票数 2
1
回答
一
类
支持向量机概率估计及其与
聚
类
的区别
、
、
、
我想学习一个类别支持向量机(OC)来模拟特定
类
(正)的分布,因为我没有足够的例子来表示其他
类
(负)。我对OC的理解是,它试图将数据从原始数据中分离出来,或者换句话说,它试图学习一个超空间来适应一个
类
数据。 如果我想用OC的输出作为概率估计,我怎么做呢?OC和任何
聚
类
算法(例如k均值)有什么区别?
浏览 2
提问于2013-01-29
得票数 2
回答已采纳
1
回答
人类可以手动
聚
类
数据集吗?最接近人类聚
类
的
聚
类
算法
、
人类是否可以手动对数据集进行
聚
类
?例如,考虑下面描述的Iris数据集: 而不是使用基于连接的
聚
类
(层次
聚
类
)、基于质心的
聚
类
、基于分布的
聚
类
、基于
密度
的
聚
类
等
聚
类
算法。等。人类可以手动对虹膜数据集进行
聚
类
吗?为了方便起见,让我们将其视为二维数据集。人类将通过哪种方式以及如何对数据集进行<em
浏览 0
提问于2015-03-16
得票数 0
1
回答
DBSCAN或HDBSCAN是更好的选择?为什么?
、
、
在DBSCAN和HDBSCAN中,哪种
聚
类
方法被认为是最好的,其背后的原因是什么?
浏览 9
提问于2020-11-24
得票数 1
1
回答
你能用
聚
类
来识别含噪数据中的信号吗?
、
、
作为我在数据科学方面的第一个项目,我想在嘈杂的数据中挑选出主要的集群。我认为一个很好的例子是尝试在一个有许多答案的给定StackExchange问题上找到某些链接。最常见的链接类型是指向SE网络上的问题的链接。下一个常见的是标记链接,或者是指向用户配置文件的链接。其余的链接可能是随机链接包括在帖子,这被认为是噪音。理想的情况下,我正在寻找一个解决方案,我不知道有多少集群的链接将提前。 我使用scikit-learn和KMeans实现了我的第一次尝试。然而,这并不理想,因为我似乎必须提前指定集群的数量,而且我认为随机、有噪音的链接分组不当。我还认为,与相对较小的URL标记相比,它在更大的语料库上
浏览 0
提问于2015-06-28
得票数 5
回答已采纳
1
回答
聚
类
法
、
、
我对数据
聚
类
非常陌生,我想知道如果我们想要执行社交网络分析或可视化,它是基于什么类型的
聚
类
技术? 有几种
聚
类
方法,例如基于层次的、基于
密度
的、基于网格的,等等。我不知道这个社会网络可视化属于哪一
类
。
浏览 4
提问于2017-01-31
得票数 0
1
回答
空间约束地理空间相似性
、
、
、
、
当前按特征对地理空间数据进行
聚
类
的方法是什么?因此,这里的一个例子是房价和人口
密度
之间的关系。但是,关键在于集群是如何被拉出来的。例如,人口
密度
高的富裕地区与人口
密度
低的富裕地区不一样。应用一个基本的距离度量不会考虑到这一点,因为低与高可能相互抵消,给出相似的距离。这导致我可能使用某种形式的加权
聚
类
来拉动质心。
浏览 0
提问于2020-05-13
得票数 4
1
回答
在scikit-learn中如何使用KDE (核
密度
估计)进行一维数组
聚
类
?
、
、
、
我读了几篇关于一维阵列
聚
类
的文章,其中有人说
聚
类
不适合一维阵列,应该使用核
密度
估计。然而,没有人解释如何使用kde准确地执行
聚
类
,如何检索输入数据的
聚
类
标签?在scikit-learn中,我得到了单变量(一维)数据的核
密度
估计。我在考虑两种可能的方法: a)使用kde为一些
聚
类
估计器(例如kmeans)获取新的2D输入数据。我想以直方图(值,频率)的形式检索2D数据数组,但我不知道
浏览 3
提问于2016-06-14
得票数 0
2
回答
低
密度
差多维数据
聚
类
的最佳
聚
类
算法是哪一种?
、
、
、
、
我目前正在做一个项目,我希望对多维数据进行
聚
类
。我尝试了K均值
聚
类
和DBSCAN
聚
类
,两者都是完全不同的算法.在尝试DBSCAN模型时,该模型产生了大量的噪声点,并在一个集群中对多个点进行了
聚
类
。我尝试了KNN dist绘图方法来为模型找到最优的eps,但我似乎无法使模型工作。这导致了我的结论,也许所绘制的点的
密度
很高,这也是我在一个星系团中得到很多点的原因。 对于集群,我使用10列不同的数据。我应该改变我正在使用的算法吗?对于多维数
浏览 0
提问于2020-03-31
得票数 2
回答已采纳
1
回答
时态地质数据的K-均值核函数
、
、
、
double geoDis = geoDis(input1, input2); //extra function} 也许有人知道一个很好的
聚
类
时态地理数据的核心功能
浏览 0
提问于2015-05-18
得票数 0
回答已采纳
1
回答
sklearn指定簇数
、
、
、
从我输入的数据中,我希望是2个簇,而不是它为我输出的3个簇。这是我代码的开始部分:original_headers = list(df.columns.values)data = df.valuesms.fit(data) lab
浏览 0
提问于2018-06-29
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于密度的聚类算法原理与实现
一种基于网格的密度峰值聚类算法
Python之K均值聚类
聚类模型之Python调参
Python机器学习sklearn模块-聚类
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券