腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
基于
最
相似项目列表
的
聚
类
算法
?
、
、
、
我是机器学习
的
初学者。我有一个大型
的
项数据集,每个数据集中都有有限
的
一组
最
相似的项,我希望创建集群,最好是每个集群都具有相同
的
大小,尽管这是不必要
的
。有人能给我指明正确
的
方向吗?谢谢。
浏览 0
提问于2018-04-21
得票数 2
1
回答
将一维数据集映射到3D空间
、
、
、
、
我有一个1D
的
数据集,如下所示我想要得到这个值集之外
的
最
频繁
的
范围我考虑应用k-mean
聚
类
算法
,取元素最多
的
聚
类
。我使用k = sqrt(n/2)在搜索时,我看到一些文章表明,对1d数据集应用k-means<
浏览 2
提问于2015-11-29
得票数 0
1
回答
Carrot2评分,标签,短语和相似性?
我不太明白Carrot2中标签和短语之间
的
区别,它们似乎没有给出I
的
明确区别。我试着把它们都打印出来,但它们显然是相同
的
(使用kmeansclustering)。有人能帮我澄清这件事吗?我也在想分数
的
问题。在
聚
类
之后,我
的
集群没有任何附加分数,我应该自己计算这些分数吗? 关于相似性,是否可以使用Carrot2来确定查询与集群有多相似?
浏览 7
提问于2014-06-04
得票数 0
回答已采纳
2
回答
如何对包含文本数据
的
图形组件进行
聚
类
?
、
、
、
、
示例: 如何制作比萨饼烹饪比萨饼
的
食谱我还有另外一个带有这些标题
的
图形组件。烤肉店烤肉串是怎么煮
的
?问题
的
方法: 有一个名为BERTopic<e
浏览 0
提问于2022-11-09
得票数 1
1
回答
从平面(2D)中
的
一组点出发,丢弃孤立
的
和组剩余
的
、
、
我目前正在从事一个需要解决以下问题
的
项目:然后,我需要能够告诉用户他用来访问该资源
的
“区域”。所谓
的
“面积”y可以是指周长(中心和比率)。(预先谢谢;)
浏览 2
提问于2011-11-16
得票数 2
回答已采纳
3
回答
mahout lucene文档
聚
类
如何实现?
、
、
、
、
我读到我可以从lucene索引创建mahout向量,该索引可用于应用mahout
聚
类
算法
。我想在我
的
Lucene索引中
的
文档中应用K-means
聚
类
算法
,但还不清楚如何应用该
算法
(或分层
聚
类
)来提取这些文档
的
有意义
的
聚
类
。在此页面中,表示
算法
接受两个输入目录:一个用于数据点,另一个用于初始
聚
<
浏览 1
提问于2009-12-04
得票数 12
回答已采纳
1
回答
Mean
算法
能用于颜色量化吗?
、
、
、
我有一个问题,决定
算法
的
颜色量化。我想做颜色量化
的
图像是分辨率为512 x 512
的
RGB图像。我想减少像素中
的
颜色值,以减小图像大小。 我不想使用流行
的
算法
k-方法。我找到了这个均值移位
算法
。均值移位是一种
聚
类
算法
(与k均值相同),它具有一定
的
质心和窗口(每个质心都有1),在其窗口中寻找
最
密集
的
部分,然后将质心移动到
最
密集<e
浏览 0
提问于2019-01-26
得票数 1
1
回答
根据s和t点间
的
最小割集将图分成两部分。
、
、
我正在实现最小割集图
聚
类
,并且我需要能够将一个图分成两个部分-- S和T,根据在每个
聚
类
步骤上构建
的
针对
的
和t顶点
的
st min裁剪。基本上,我希望有一个函数,它接受图G、节点s和节点t,并返回两个不相交
的
节点集S和T<code>E 217</code>。据我所知,找到最小流量
的
最
简单
方法是利用最小切割~最大流量对偶,并使用推挽
算法
进行最大流量计算
浏览 6
提问于2013-07-16
得票数 1
1
回答
如何高效地查找相似文档
、
、
、
、
我有很多使用
聚
类
算法
进行
聚
类
的
文档。在
聚
类
算法
中,每个文档可以属于一个以上
的
聚
类
。我已经创建了一个存储document-cluster赋值
的
表和另一个存储cluster-document信息
的
表。我首先检索它所属
的
集群列表(从document-cluster表中),然后对于document-cluster中
的
每
浏览 0
提问于2015-05-05
得票数 0
5
回答
算法
问题,在一堆数字里 找出分布范围比较接近而且数量最多
的
那一堆数?
、
请教各位大佬一个问题 和比较多
的
那个范围距离太远了
浏览 995
提问于2018-05-09
1
回答
聚
类
有效性指数是否应该包含与
聚
类
算法
相同
的
度量(S)?
我目前正在尝试使用聚类分析作为我
的
一个项目的时间序列聚合工具。数据集是高维
的
(386-d),因此无法直观地评估
聚
类
有效性.我使用三种不同
的
聚
类
算法
(k-均值++,k-medoids PAM,模糊c-均值)来寻找具有代表性
的
周期。(基本过程:运行多个k
的
聚
类
,并按k绘制cvi;根据cvi最优选择最高/最低
的
k)。 让我们以k-均值为例。它是不确定
的
浏览 0
提问于2019-05-28
得票数 1
回答已采纳
1
回答
为什么降维能提高电影海报
的
无监督
聚
类
性能?
、
、
、
、
我正在写一篇论文,试图根据电影海报
的
视觉特征对它们进行
聚
类
。我们
的
目标是将看起来类似的电影海报聚集在一起。根据提取
的
特征,我想: 获得一张与给定海报
最
相似的海报清单(例如,与马达加斯加海报
最
相似的n张海报)。我将使用
的
聚
类
算法
是K-均值,我已经用剪影系数评估了
聚
类
的<
浏览 1
提问于2018-10-30
得票数 0
1
回答
最好
的
聚
类
算法
,客户细分
、
、
、
我有一个数据集
的
分类和数值变量,我想知道什么是最好
的
算法
聚
类
客户? 如何找到细分客户
的
基本模式??
浏览 0
提问于2023-02-26
得票数 1
7
回答
K-均值
聚
类
能进行分类吗?
、
、
、
我想知道k均值
聚
类
算法
是否能做分类?假设我有很多数据,我使用k-均值
聚
类
,然后得到2簇A,B,质心
的
计算方法是欧氏距离。B组在右侧。所以如果我有一个新
的
数据。我该怎么办? 记
浏览 5
提问于2014-03-10
得票数 22
回答已采纳
1
回答
是否有任何方法来确定在特定数据集上使用哪种
聚
类
算法
?
、
、
、
我很难获得有效
聚
类
数据
的
方法。即使对于具有5个类别的
简单
属性,它也不能很好地分割数据。我知道DBSCAN、分层
聚
类
和GMM。但是,在开始为每种
算法
编写代码之前,我只想知道是否有任何方法(视觉或其他方式)来缩小可能在所讨论
的
数据集上工作
的
聚
类
算法
。 提前谢谢。
浏览 0
提问于2019-07-30
得票数 1
回答已采纳
1
回答
我如何使用lucene index部署lucene web应用程序集群我自己
的
数据
当我使用lucene web应用程序对我自己
的
数据进行carrot2索引
聚
类
时,我发现结果与我
的
预期不同。错误一:在右边
的
结果列表中只列出了集群文件名,没有匹配
的
文本段落和文件位置,我不确定是什么导致了问题,我猜可能是我使用lucene创建索引文件格式错误,或者是我
的
configuration carrot2web-app项目存在问题,希望有人能告诉我答案 如果有人能回答我
的
疑问,我将不胜感激,你
的
回答将是有帮助
的
浏览 4
提问于2016-05-09
得票数 0
2
回答
采样是降低复杂性
的
有效方法吗?
、
我面临
的
一个问题是,我需要大量
的
数据来进行
聚
类
。正如我们所知道
的
,
聚
类
算法
可能具有很高
的
O复杂度,我正在寻找减少
算法
运行时间
的
方法。我想尝试几种不同
的
方法,如预
聚
类
(冠层
聚
类
)或子空间
聚
类
、相关
聚
类
等。但是,我还没有听说过一些事情,我想知道
浏览 0
提问于2020-11-08
得票数 6
回答已采纳
2
回答
对于高维数据流中
的
孤立点检测,
聚
类
特征和微观
聚
类
是否具有较好
的
汇总统计量?
、
、
、
、
我在处理数据流中
的
离群点检测。我正在寻找一种方法来总结我
的
数据并获得重要
的
统计数据,如均值和方差等。我想知道集群特性或微集群是否合适。
浏览 0
提问于2019-12-22
得票数 0
1
回答
是否有一种仅以成对距离作为输入
的
聚
类
算法
?
我
的
数据是我知道所有成对旅行时间(=‘距离’)
的
地方,我想把这些地方聚在一起,使集群内
的
成对旅行时间最小化。不能使用K-表示,因为它是基于质心
的
,而且“距离”是提供
的
持续时间,而不是根据坐标计算
的
。不能使用DBSCAN,因为它排除了外围行,我希望将每个位置都包含在集群中(对于这个位置不是100%确定) 额外好处: Java库将是非常感谢
的
浏览 0
提问于2020-10-29
得票数 3
回答已采纳
1
回答
如何通过汉明或Levenshtein距离对字符串进行
聚
类
、
、
、
作为练习,我想通过Hamming或Levenshtein距离对一组英语单词进行
聚
类
。如果是汉明距离,它们都必须是相同
的
长度(或填充到相同
的
长度),但对于Levenshtein距离则不是这样。我通常使用scikit-learn,它有很多
聚
类
算法
,但似乎没有一个接受分类变量数组,这是表示字符串
的
最
明显方式。 我可以预先计算一个巨大
的
距离矩阵,但如果字符串
的
数量很大,这是不现实
的
。如何有
浏览 44
提问于2021-06-14
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
5种主要聚类算法的简单介绍
DBSCAN聚类算法详解
机器学习常见的聚类算法
如何用聚类算法分析用户?
机器学习-无监督算法-聚类
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券