腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
带
权重
的
聚类分析
、
、
、
我有一个数据框“热度”,展示了人们在不同时间
的
表现。'Var2‘表示一条时间线(从起点算起
的
天数)。 geom_vline(xintercept = c(746, 2142, 2917)) 它看起来是这样
的
浏览 19
提问于2018-02-12
得票数 0
1
回答
在分类数据
的
记录中查找异常
、
、
、
我有一个数据集,其中有m个观察值和p个分类变量(标称),每个变量X1,X2...Xp都有几个不同
的
类(可能
的
值)。最终,我正在寻找一种发现异常
的
方法,即根据我到目前为止看到
的
数据,识别那些值组合似乎不正确
的
行。到目前为止,我正在考虑构建一个模型来预测每列
的
值,然后构建一些度量来评估实际行与预测行
的
不同程度。
浏览 12
提问于2018-02-27
得票数 0
1
回答
使用文本和数值特性进行聚类
、
、
、
、
我有一个包含两种特征类型
的
数据集,一种是从doc2vec生成
的
,另一种是数值特征。我想对它们进行
聚类分析
。然而,由于doc2vec特性
的
大小,如果我简单地将它们组合成一个数组,聚类算法就会更多地分配doc2vec特性上
的
“
权重
”,如何克服这个问题?例如,对于给定
的
标签,假设我有来自doc2vec
的
类似于这个1,2,3,4,5
的
特性,以及数字特性2。我不想简单地将它们合并到1,2,3,4,5,2中并执行
聚类分析
。理想情
浏览 0
提问于2021-01-21
得票数 1
1
回答
查找两个用户配置文件之间
的
相似性
、
、
、
我有具有以下属性
的
用户配置文件。U={年龄、性别、国家、种族}是寻找两个用户之间相似性
的
最好方法吗?例如,我有以下两个用户。这对我
的
问题或其他建议有好处吗。
浏览 2
提问于2015-05-29
得票数 1
回答已采纳
2
回答
在SPSS中使用哪种分析来找出分组/分组?
、
我
的
研究问题是关于老年人
的
,我必须找出潜在
的
群体。数据来自一份调查问卷。我曾考虑过
聚类分析
,但问题是我想搜索感知到
的
健康以及哪些因素会影响感知到
的
健康,例如,哪类老年人将自己
的
健康评为不良。我有大约30个问题想通过分析来检查,看看例如寡妇
的
健康状况是否比平均水平更好或更差。我
的
数据中也有
权重
,所以我需要使用复杂
的
样本。 我如何使用一个已经存在
的
函数,或者我应该使用什么分析?
浏览 0
提问于2012-08-22
得票数 1
1
回答
如何计算橙中
的
加权层次聚类
、
我正在用桔黄色
的
进行我
的
第一次
聚类分析
(我最近发现了这个
聚类分析
,它看起来很适合这个迭代和交互过程)。显然,有几种基于距离算法
的
聚类方法:平均链接(计算两个集群元素之间
的
平均距离)加权连杆由于我有几个列不幸
的
是,我不知道如何做到这一点,因为我没有找到为每一列分配
权重
的
方法。更糟糕
浏览 0
提问于2019-03-13
得票数 1
2
回答
一个热编码/不平衡列会导致
聚类分析
的
偏差吗?
、
、
、
、
我想知道,对于某一特定特性,过多
的
列是否会导致对
聚类分析
的
偏见。例如,如果我
的
数据集有列= “来电”、“对外电话”、“失踪电话”、“年龄”,如果我运行诸如K-均值或混合模型之类
的
聚类算法,那么聚类结果是否会有偏差,因为它主要基于调用来分割数据集?如果我在一个热编码
的
数据集中,颜色在分割数据方面会比形状有更大
的
权重
吗?
浏览 0
提问于2020-05-28
得票数 2
4
回答
Mclust:影响聚类结果
的
输入参数顺序
、
我正在使用mclust来查看我
的
数据集中
的
各种集群,使用不同数量
的
输入(下面脚本中
的
X、Y、Z、R和S):elements<-cbind(X,Y,Z,R,S)我刚刚发现输入参数
的
顺序很重要,并影响结果;换句话说,与elements-<cbind(Y,Z,X,R,S)相比,elements <- cbind(X,Y,Z,R,S)给出了不同
的
聚类我
的
理解是,在
聚类分析</em
浏览 1
提问于2013-12-05
得票数 5
1
回答
对齐列表视图上
的
列标题
我在对列表视图上方
的
一些标题有一些困难。 我想对齐标题上方
的
各自
的
按钮。我
的
布局代码: android:orientation="vertical" androidmatch_parent" an
浏览 5
提问于2014-08-12
得票数 1
回答已采纳
4
回答
两个顶点之间
的
最长路径
、
我有一个
带
权重
边
的
有向图(
权重
都是正数)。 现在,我正在寻找一种有效
的
算法或代码(具体地说,C#)来找到两个给定顶点之间
的
最长路径。
浏览 0
提问于2009-08-10
得票数 4
1
回答
graphml
的
Jung加权边
、
、
、
我使用
的
是Jung 2.0。我有一个
带
权重
边
的
graphml文件。我正在使用graphml阅读器读取文件并创建图形。当我使用FRLayout可视化该图时,我观察到该图没有反映与边相关联
的
权重
。我必须专门为边指定
权重
吗?如果是这样,我该怎么做呢?
浏览 1
提问于2011-04-06
得票数 0
回答已采纳
1
回答
基于聚类算法
的
R中小区检测
的
0~1外模值
、
、
我试图用加权边缘
权重
(即多脉络相关)对我
的
论文进行社区检测分析。我正在使用Spinglass
聚类分析
来检测社区。由于某些原因,我
的
模块化(Q)值不属于预期
的
0到1范围(根据我已经阅读过
的
文献)。attributes = TRUE) cluster_spinglass(graphTAD) + groups: $
浏览 1
提问于2021-02-06
得票数 0
1
回答
不带www跳转到www使用DNS 解析
的
cname 还是Nginx 301重定向?
、
我现在想把自己
的
域名中不带www
的
换成
带
www
的
,及test.cn 换成www.test.cn server {} listen 80; # 自己
的
HTML文件配置2.通过DNS解析方式,设置test.cn
的
cname为w
浏览 1746
提问于2017-11-20
1
回答
在geom_smooth命令中使用
权重
时,黄土消失
的
置信区间
、
、
Pinera, weight = pesos)) + geom_smooth(method = loess, se = TRUE) 第一个从我
的
数据中给出了一条未加权
的
平滑曲线,带有阴影
的
置信区间,但是当我添加
权重
时,置信区间区域消失了,尽管我声明了se = TRUE。这是我
的
浏览 0
提问于2017-04-17
得票数 2
1
回答
使用Numpy进行前后MultiMatrix乘法
、
、
、
我想计算投资组合
的
方差:weights = np.array([.3,.7]).reshape(1,2)correl = np.array([[[1,.4],[.4,1]],[[1,.6],[.6,1]]])有没有一种方法可以选择(2,2,2)张量
的
轴来乘以子矩阵?
浏览 20
提问于2018-05-31
得票数 0
1
回答
在python中对地理编码/(经度/经度)数据点进行
聚类分析
的
最佳方法是什么?
、
、
、
在python中对地理编码/(经度/经度)数据点进行
聚类分析
的
最佳方法是什么?我也尝试过使用DBscan,但我认为它不是基于我
的
数据集执行
聚类分析
的
最佳工具。
浏览 2
提问于2016-01-27
得票数 1
2
回答
将带误差条
的
点添加到Matlab散点图中
、
我已经在matlab中执行了多维
聚类分析
。对于每个聚类,我计算了均值和协方差(假设条件独立)。换句话说,我想在散点图中添加一些
带
误差条
的
数据点。对如何做到这一点有什么建议吗?
浏览 1
提问于2013-03-18
得票数 3
1
回答
由分类数据和连续数据组成
的
数据集
的
聚类分析
?
、
我一生中从来没有做过
聚类分析
,我整齐地遵循了一本关于如何在R中进行
聚类分析
的
书中
的
步骤。R:无监督机器学习
的
聚类分析
实用指南:第1卷(多元分析),Alboukadel Kassambara先生 然而,我遇到了一个问题,因为在这本书中,数据标准化取代了数值变量,然而,我有一个由13个变量组成
的
数据集,其中最主要
的
是分类。我查过google和一些堆叠溢出问题,我找不到一个明确
的
答案,比如如何处理分类变量和连续变量组合
的
<
浏览 2
提问于2018-07-18
得票数 0
回答已采纳
1
回答
Apache Mahout中
的
加权朴素贝叶斯分类器
、
、
、
但不幸
的
是,我在客户支持领域中没有大量
的
带
注释
的
数据集。但我在同一领域中有少量
带
注释
的
数据(大约100个正值和100个负值)。我也有亚马逊
的
产品评论数据集。我可以使用mahout实现一个加权
的
朴素贝叶斯分类器吗,这样我就可以给一小部分客户支持数据更多
的
权重
,给亚马逊
的
产品评论数据更小
的
权重
。我想,在上述加权数据集上进行训练将极大地提高准确性。请帮我做同样
的
浏览 0
提问于2011-12-20
得票数 2
回答已采纳
1
回答
在Python编程中使用numpy和nltk或CLUTO对单词进行聚类
、
、
、
我
的
部分数据如下所示(这只是个例子)。cat 8 2.3 3.4 4.7horse 3.4 2.5 8 1.5数字越大,表示两个单词之间
的
相似度越高基于这种格式
的
数据,我想做一个聚类(例如,(猫,狗),(马),(驼鸟)共3个聚类)。但是我不能..。因此,我尝试使用nltk中
的
一些集群库,如k-means..等。但我不知
浏览 3
提问于2013-12-26
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
聚类分析的基本概况
聚类分析:数据挖掘的关键突破口!
接手的网店权重不高?教你全面激发网店权重
什么是百度权重?影响权重的因素有哪些?
PDD商家怎么提高权重?影响店铺权重的因素有哪些?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券