腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(530)
视频
沙龙
1
回答
核
k
均值
和
谱
聚
类
之间
的
实际区别是什么?
、
、
、
最近我一直在想核
k
均值
和
谱
聚
类
算法及其区别。 我知道光谱
聚
类
是一个更广泛
的
术语,不同
的
设置可能会影响它
的
工作方式,但一个流行
的
变体是使用
K
-
均值
聚
类
对亲和
矩阵
的
谱嵌入。另一方面,核
K
-
均值
直接将
K
-
均值
聚
浏览 0
提问于2020-01-09
得票数 12
2
回答
解释
聚
类
度量
、
、
我在Scikit中用
k
均值
进行
聚
类
,学习398个
样本
,306个特性。
特征
矩阵
稀疏,簇数为4。为了改进
聚
类
,我尝试了两种方法: 我使用PCA将
特征
维降为2。我计
浏览 4
提问于2016-08-03
得票数 1
回答已采纳
1
回答
多变量
聚
类
、
、
、
我
的
dataSet就像这样可以使用哪种
聚
类
方法,以及如何使用?
浏览 0
提问于2018-01-18
得票数 5
回答已采纳
1
回答
PCA是如何给出中心知识
的
方法
的
?
、
、
我正在查看在上给出
的
示例代码# in this case the seeding of the centers is deterministic, hence we run the# kmeans algorithm only once with n_init=1bench_
k
_means(
浏览 3
提问于2014-08-07
得票数 3
回答已采纳
2
回答
如
何在
具有
569行(
样本
)
和
30列(
特征
)
的
数据
矩阵
上
初始化
K
均值
聚
类
?
、
、
我无法理解如何开始我
的
解决方案。我有一个569行
的
矩阵
,每个行代表我
的
数据
的
一个
样本
,30列代表每个
样本
的
特征
。我
的
直觉是绘制每一行,并查看集群(如果有)是什么样子,但我不知道如
何在
单个散点图上做超过2行。 我花了几个小时浏览教程,但还不能理解如何将其应用于我
的
数据
。我知道散点图以2个向量作为参数,那么我怎么可能绘制所有569个
样本</e
浏览 49
提问于2019-04-09
得票数 1
回答已采纳
1
回答
如何通过橙色(GUI)使用测试学习者
和
混淆
矩阵
、
、
我用旧标签(
如
集群ID )测试一些
数据
,然后使用
K
-
均值
聚
类
生成新
数据
,新属性由集群ID
的
新标签产生。但问题是,我不知道如
何在
Orange GUI上操作,以评估新旧标签之间
的
聚
类
效果如下: (1)混淆
矩阵
(GUI)不能直接连接到
k
均值
聚
类
的
输出
数据
.我想我
浏览 3
提问于2014-12-26
得票数 1
回答已采纳
1
回答
为什么降维能提高电影海报
的
无监督
聚
类
性能?
、
、
、
、
为了从数量
上
描述海报
的
“外观”,我使用预先训练过
的
VGG16 CNN为所有海报提取了25088个
特征
。这些特性存储在一个带有尺寸
的
矩阵
中(#电影海报,25088)。我将使用
的
聚
类
算法是
K
-
均值
,我已经用剪影系数评估了
聚
类
的
质量。我尝试了以下几点: 使用
K
-
均值
的
原始
特征
进
浏览 1
提问于2018-10-30
得票数 0
3
回答
我们能在这个
矩阵
上
使用
k
-
均值
聚
类
吗?
、
、
、
下面一行代表-40到400度
的
温度,7列代表热电偶
的
类型(B,J,
K
.)15.975 3.164 20.255 12.603 3.304 28.146,我
的
问题是:当所有列在不同状态下包含相同
的
实体时,能否对这种类型
的
矩阵
使用
聚
类
算法?如果没有,那么可能
的
识别方法是什么?
浏览 7
提问于2013-11-11
得票数 0
2
回答
如何将机器学习分类方法应用于一维时间序列
数据
、
、
我有IMU
数据
(加速计、磁力计
和
陀螺仪),在不同
的
练习中(下沉、俯卧撑、仰卧起坐、穿孔)。这些练习是在单个1D时间序列信号中完成
的
,我想使用机器学习分类方法来识别信号中
的
不同练习。我不想将信号压缩成0D峰值,并以这种方式构建我
的
特征
,而是保持时域
的
完整性。下图显示了包含四个练习
的
加速度计
的
示例
数据
。因此,我
的
问题是,在这样做时,哪种方法最有效?
K
-means<em
浏览 2
提问于2018-05-25
得票数 2
2
回答
如何对大型
数据
集进行
聚
类
、
、
我有一个非常大
的
文档
数据
集(5亿),并希望根据其内容对所有文档进行
聚
类
。参考:我正在使用Elasticsearch来存储我
的
数据
。
浏览 1
提问于2015-05-12
得票数 2
回答已采纳
1
回答
是否有一种仅以成对距离作为输入
的
聚
类
算法?
我
的
数据
是我知道所有成对旅行时间(=‘距离’)
的
地方,我想把这些地方聚在一起,使集群内
的
成对旅行时间最小化。不能使用
K
-表示,因为它是基于质心
的
,而且“距离”是提供
的
持续时间,而不是根据坐标计算
的
。不能使用DBSCAN,因为它排除了外围行,我希望将每个位置都包含在集群中(对于这个位置不是100%确定) 额外好处: Java库将是非常感谢
的
浏览 0
提问于2020-10-29
得票数 3
回答已采纳
3
回答
如何对(
k
-
均值
)
聚
类
模型中
的
某些
特征
给予更高
的
重视程度?
、
、
、
我用数字
和
分类变量对
数据
进行
聚
类
。为了处理集群模型
的
分类变量,我创建了虚拟变量。然而,我觉得这会对这些虚拟变量产生更高
的
重要性,因为多个虚拟变量代表一个范畴变量。例如,我有一个分类变量Airport,它将导致多个虚拟变量: LAX、JFK、MIA
和
BOS。现在假设我也有一个数值温度变量。现在,我
的
机场变量似乎是温度变量
的
4倍,集群主要是基于机场变量。我
的
问题是,我希望所有变量都
具有
同样
的</
浏览 0
提问于2019-04-16
得票数 6
回答已采纳
2
回答
如果我
的
全部训练文件都是A
类
,我如何使用TF-国防军找到A
类
的
其他文件?
、
、
、
我收集了X个文档,所有这些文档都属于A
类
(是我感兴趣或了解
的
唯一
类
)。我也有一个更大
的
收集Y文件,我不知道。X
和
Y中
的
文档来源相同,格式相似,主题也有些相似。我想使用X中文档
的
TF-国防军
特征
向量来查找Y中最有可能属于A
类
的
文档。在过去,我使用TF-国防军
特征
向量来构建朴素
的
Bayes分类器,但在这些情况下,我
的
训练集X由许多
类
的</em
浏览 5
提问于2015-09-13
得票数 1
回答已采纳
1
回答
在使用R进行
K
均值
聚
类
后,检索最接近每个
聚
类
质心
的
100个
样本
、
、
、
我试图通过首先在R中执行
K
-means
聚
类
,然后在每个代表性
聚
类
中采样50-100个
样本
来减少输入
数据
大小,以便进行下游分类
和
特征
选择。 原始
数据
集被分割为80/20,然后80%进入
K
均值
训练。我知道输入
数据
有2列标签
和
110列数值变量。从标签栏中,我知道有7种不同
的
药物治疗方法。同时,我测试了肘部方法,以找到
浏览 30
提问于2020-11-02
得票数 0
回答已采纳
3
回答
比
k
均值
聚
类
更精确
的
方法
、
、
、
在径向基函数网络(RBF网络)中,选择了隐层中
的
所有原型( RBF函数
的
中心向量)。此步骤可以通过以下几种方式执行: 智能选择原型
的
方法之一是在训练集上进行
k
均值
聚
类
,并使用
聚
类
中心作为原型。我们只知道
k
均值
聚
类
<e
浏览 7
提问于2014-03-06
得票数 1
回答已采纳
1
回答
K
-
均值
聚
类
对使用PCA
和
原始
数据
减少
的
数据
有什么不同吗?
、
、
、
、
我正在做
聚
类
工作,我有90个
特征
,有13500个
数据
点,去除了相关变量,其中皮尔逊相关性超过90%,我
的
特征
空间减少到70个。而且,几乎所有我最初
的
90个特性都有大量
的
零值(超过70%-80%
的
数据
点)。我在算法实现方面所做
的
是: Ran
K
-通过根据轮廓指数选择
聚
类
数来表示原始
数据
的
70个
特征</em
浏览 0
提问于2020-01-21
得票数 3
1
回答
K
均值
聚
类
前
的
主成分分析
、
、
、
、
如果我将PCA应用于
特征
向量,然后进行
聚
类
,如下所示:kmeans = KMeans(init='
k
-means++', n_clusters=n_digits, n_init=10) 减少
的
数据
将是PCA
的
组成部分,所以在用
k
均值
聚
浏览 3
提问于2017-02-27
得票数 0
2
回答
用python中
的
散点图来表示
K
-
均值
聚
类
中接近质心
的
点。
、
我正在编写一个简单
的
K
均值
聚
类
算法,并试图呈现一个显示
样本
数据
的
散点图(从CSV文件加载到numpy
矩阵
X中
的
样本
数据
行)。 假设X是一个numpy
矩阵
,每一行都包含有10个特性
的
示例
数据
。就我
的
情况而言,它们是包含src IP地址、目标IP地址、src端口或目标端口
的
网络流
的</em
浏览 4
提问于2017-05-05
得票数 0
回答已采纳
1
回答
K
-
均值
聚
类
的
内存问题
、
我试图使用
K
表示
聚
类
从搜索历史记录中对关键短语进行
聚
类
,但在运行stringdistmatrix()命令时,我遇到了“不能分配大小为30 of
的
向量”
的
错误。我使用
的
数据
集包含63455个唯一元素,因此处理结果
矩阵
需要大约30 to
的
内存。有没有办法在不失去太多意义
的
情况下降低流程
的
要求?下面是我试图运行
的
代码,如果您碰巧注意到任何其他错误: #
浏览 1
提问于2019-07-08
得票数 1
回答已采纳
1
回答
机器学习算法在
数据
属性子集中
的
应用
、
、
、
、
我有一个庞大
的
混合
数据
集,它由数值属性
和
分类属性组成,在OneHotEncoding
上
形成一个
具有
很高维数
的
数据
集。 将机器学习算法(
如
K
-
均值
聚
类
、降维和回归)应用于
数据
集子集是否明智?例如,首先将
K
-
均值
聚
类
应用于数值列,然后将结果与分类
数据
集连接起来。
浏览 0
提问于2018-02-28
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 谱聚类算法从零开始
源自斯坦福CS229,机器学习备忘录在集结
K-Means实战精粹:从原理到应用
机器学习之K均值算法
机器学习——K-均值算法理论
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券