腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
即使
我
不想
预测
任何东西
,
我
也
需要
K-means
聚
类
的
测试
训练
拆分
吗
?
、
、
、
我
有一组2000个点,它们基本上是足球协会传球来源
的
x,y坐标。
我
想对其运行
k-means
聚
类
算法,以便对其进行分类,以获得最常见
的
10个过程(k=10)。但是,
我
不想
预测
未来值
的
任何点。
我
只是想使用现有的数据。
我
还
需要
把它分成
测试
训练
集
吗
?
我
假设只有当我们想要在特定集合上<
浏览 22
提问于2019-04-01
得票数 1
1
回答
如何执行半监督k均值
聚
类
、
我
是r
的
新手。
我
正在尝试执行半监督
k-means
聚
类
。
我
计划将2/3
的
数据划分为
训练
集,1/3作为
测试
集。
我
的
目标是使用已知
的
聚
类
训练
一个模型,然后将
训练
模型传播到
测试
集。传播结果将与先前
的
聚
类
进行比较
浏览 0
提问于2016-04-16
得票数 0
1
回答
如何通过make_pipeline()标准化
训练
和
测试
数据集
、
、
、
我
正在学习如何使用make_pipeline运行K均值模型来标准化
我
的
数据集列
的
值。
我
正在学习DataCamp课程,但我不清楚为什么他们会在相同
的
数据集上拟合和
预测
模型-in Datacamp case“model”,这是一个每日股票价值数据集。
我
认为
K-means
模型
的
全部目的是在
训练
数据集上进行
训练
,并
预测
测试
数据集? 与Datacamp案例
浏览 37
提问于2018-12-24
得票数 2
回答已采纳
1
回答
如何使用DBSCAN指定集群中
的
最大点数?
、
、
我
知道DBSCAN有一个参数指定最小点数(最小点),但我想限制集群上
的
最大点数?你知道
我
该怎么做
吗
?
我
已经调查过了,但是
我
没有发现
任何东西
。例如,对于每个集群,
我
只希望通过dbscan分组最多4个点,谢谢!
浏览 9
提问于2020-05-14
得票数 1
3
回答
为什么在无监督学习算法
的
训练
和
测试
中数据不分裂?
、
、
我们知道,
预测
和分类问题可以根据
训练
比率(一般为70-30或80-20分裂)打破数据,其中
训练
数据传递给一个模型以适应,并根据
测试
数据对其输出进行
测试
。Accuracy of the model = (25/30)*100 = 83.33%让我们将同样
的
东西应用于无监督
的
学习,比如
聚
类
。 这里没有目标变量,只有集群变量存在。,我们可以对70条随机记录进行
聚
类
,并使用其余
浏览 0
提问于2019-07-17
得票数 1
2
回答
spark
的
MLlib库中是有监督还是无监督
的
流式
k-means
聚
类
?
、
、
、
、
我
知道
k-means
聚
类
是最简单
的
无监督学习算法之一。查看MLlib中打包
的
流式
k-means
聚
类
的
源代码,
我
发现了术语:
训练
数据、
测试
数据、
预测
和
训练
。这让
我
认为这个流式
K-means
可能是受监督
的
。那么,这个算法是有监督
的
还是无监督
的
?
浏览 3
提问于2015-06-22
得票数 1
3
回答
kmeans与大数据
、
、
我
想将具有kmeans
的
大数据矩阵(500万X 512)群集到5000个中心。
我
使用R是为了不让这个矩阵耗尽
我
的
内存。
我
写了这段代码,将txt矩阵转换为xdf,然后进行集群:vars <- rxGetInfo(outFile
浏览 7
提问于2013-08-04
得票数 3
2
回答
快速挖掘器中
的
交叉验证
聚
类
、
、
、
我
不知道
我
做错了什么,但我希望有人能帮我。
我
正在尝试使用
k-means
聚
类
作为
我
的
模型,在rapid miner中运行x-validation。
我
导入了
我
的
数据集,在一个属性上设置了'label‘
的
角色,将数据从名义转换为数字,然后将输出连接到x-validation过程。然后,
我
将
训练
数据连接到
k-means
浏览 0
提问于2014-12-15
得票数 0
1
回答
如何将给定样本
聚
类
到谱
聚
类
算法计算
的
类
中心?
、
、
假设我们根据谱
聚
类
算法得到几个具有
训练
样本
的
中心{C1(d1,d2...dn),C2...}。如果一个新
的
测试
样本向量(x1,...xn),
我
应该怎么做才能把它放到一个
类
中?请注意,我们在谱
聚
类
过程中使用
的
相似性矩阵不仅基于
训练
向量之间
的
欧几里德距离,还基于测地距离。因此,距离不能仅用两个向量来计算,并且
类
中心
也
不像我们在<em
浏览 3
提问于2011-01-05
得票数 2
4
回答
我
在100维空间中有2,000,000个点。
我
如何将它们群集到K(例如,1000)个群集?
、
我
有M个图像,每个图像提取N个特征,每个特征
的
维度是L。因此,
我
有M*N个特征(
我
的
例子是2,000,000个),每个特征都有L个维度(
我
的
例子是100)。
我
需要
将这些M*N个特征
聚
类
到K个集群中。
我
该怎么做呢?谢谢。
浏览 3
提问于2010-11-11
得票数 3
回答已采纳
1
回答
使用经过
训练
的
K-Means
模型
预测
未见数据
的
正确
聚
类
、
、
、
、
我
知道
K-Means
是一个懒惰
的
学习者,必须用新
的
点从头开始重新
训练
,但我仍然想知道是否有任何解决方案可以使用经过
训练
的
模型来
预测
新
的
未知数据。
我
正在使用
K-Means
算法对一个医学语料库进行
聚
类
。
我
正在创建一个术语文档矩阵来表示这个语料库。在将数据提供给kmeans算法之前,
我
对数据进行截断奇异值分解以进行降维。
我</
浏览 18
提问于2019-02-04
得票数 1
1
回答
如何在python中对“预先计算”
的
数据运行predict()以进行
聚
类
、
我
有自己
的
预先计算
的
数据,用于在python中运行AP或Kmeans。但是,当我想对数据运行train()和test()以查看
聚
类
在
类
或集群上是否具有良好
的
准确性时,Python告诉
我
predict()对“预先计算”
的
数据不可用。有没有其他方法可以在python中对集群数据进行
训练
/
测试
?
浏览 3
提问于2019-02-23
得票数 2
1
回答
R-
预测
自定义
聚
类
、
我
已经实现了自己
的
聚
类
算法,
我
需要
知道
的
是如何使
我
的
聚
类
可以被默认方法"predict“用来
预测
测试
集实例
的
聚
类
归属。
我
有了
训练
集,
我
在它们
的
基础上建立了集群,并获得了一个新对象,表示集群
的
中心,并为
训练
浏览 0
提问于2013-02-08
得票数 2
回答已采纳
1
回答
使用
K-means
聚
类
文本数据中
的
聚
类
ID作为监督学习模型
的
特征是不是一个坏主意?
、
、
、
、
我
正在构建一个模型,该模型将
预测
流经管道
的
产品
的
提前期。
我
在想,最好对这些数据进行某种类型
的
聚
类
,然后使用集群ID作为
我
的
模型
的
一个特
浏览 1
提问于2020-02-09
得票数 1
3
回答
此场景
的
文本分类技术
、
、
、
我
对机器学习算法完全陌生,
我
有一个关于数据集分类
的
快速问题。培训数据是通过从工具中提取特定类别并相应地加上标签来编制
的
。现在,
测试
数据只包含消息,
我
正试图获得相应
的
分类。
我
有一个经过
训练</
浏览 4
提问于2017-08-30
得票数 0
回答已采纳
2
回答
带有预定义种群
的
Matlab: K-均值
聚
类
、
、
、
我
试图区分两个群体。每个种群都是一个NxM矩阵,其中N是固定在两者之间
的
,M是可变长度
的
(每次运行
的
N=column特定属性,M=run数)。
我
看过PCA和K-区分这两种方法
的
方法,但我对最佳实践很好奇。 据我所知,在K-
的
意思中,没有初始
的
“校准”来选择星系团,这样就可以区分已知
的
双峰种群。
我
想告诉
聚
类
算法,
我
想要两个种群分离
的
最佳匹配。然后,
浏览 3
提问于2012-07-30
得票数 0
1
回答
根据映射任务
的
数量,Mahout
K-means
具有不同
的
行为
、
、
我
在运行Mahout
K-means
时遇到了一个奇怪
的
情况:使用预先选择
的
一组初始质心,
我
在lucene.vector生成
的
SequenceFile上运行
K-means
。当使用单个映射器(考虑Hadoop
拆分
大小
的
默认值,在
我
的
集群中是128MB)执行
K-means
时,它在2次迭代中达到给定
的
聚
类
结果(案例A)。但是,
我
浏览 2
提问于2012-09-27
得票数 0
回答已采纳
1
回答
从
聚
类
获得
的
标注在视觉上看起来不正确
、
、
、
、
我
有以下基于10个数据点
的
距离矩阵:sns.heatmap(distance_matrix_df, cmap='RdYlGn_r', annot=True, linewidths=0.5)接下来,
我
想将在运行实际
的
集群之前,
我
检查了热图以
预测
集群。很明显,#8是一个异常值,它本身就是一个集群。 接下来,
我
运行
浏览 3
提问于2020-10-24
得票数 1
2
回答
从文档中提取内容
、
、
、
、
我
想从简历中提取内容,如技能,认证,工作经验等与NLP
的
各种部分,并标记他们
的
类别。虽然
我
可以编写基本
的
规则来提取各种标点符号上
的
文本,但它在某些情况下可能不起作用。在这种情况下,会有所帮助
吗
?解决这个问题
的
正确方法是什么?
浏览 3
提问于2017-12-19
得票数 0
2
回答
如何使用TensorFlow对某些文本进行
聚
类
、
对由于这一领域尚处于起步阶段而造成
的
任何不准确之处表示歉意。在
我
的
版本中,
我
试图
训练
这个模型来学习三个
浏览 0
提问于2020-04-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
KMeans算法与交通事故理赔审核预测
深度学习的关键:无监督深度学习简介
7 种机器学习算法的 7 个要点
性能提升25倍:Rust有望取代C和C++,成为机器学习首选的Python后端
FAIR提出用聚类方法结合卷积网络,实现无监督端到端图像分类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券