腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
:
根据
值
设置
PCA
自动
绘制
的
数
据点
大小
、
、
我正在使用autoplot函数来
绘制
主成分分析图。: library(ggfortify)autoplot(prcomp(df), data=iris, colour = "Species") 我想使用
PCA
图中每个数
据点
的
大小
与iris[c(4)]
的
值
相对应
的
方式来使用iris[c(4)]。虹膜数据集
的
一个示例:数
据点
132
的</em
浏览 64
提问于2019-08-24
得票数 0
回答已采纳
1
回答
PCA
Biplot :一种隐藏向量以清晰看到所有数
据点
的
方法
我正试着和
R
一起做
PCA
。或 我可以用plot得到主成分分析结果。但是我不确定如何
根据
我
的
数
据点
来标记这些点,这些数
据点
的<
浏览 0
提问于2012-11-14
得票数 3
回答已采纳
1
回答
K-均值聚类对使用
PCA
和原始数据减少
的
数据有什么不同吗?
、
、
、
、
我正在做聚类工作,我有90个特征,有13500个数
据点
,去除了相关变量,其中皮尔逊相关性超过90%,我
的
特征空间减少到70个。而且,几乎所有我最初
的
90个特性都有大量
的
零
值
(超过70%-80%
的
数
据点
)。我在算法实现方面所做
的
是:我所观察到
的<
浏览 0
提问于2020-01-21
得票数 3
1
回答
用
R
中
的
自图(ggfortify)
绘制
主成分3,4
、
、
、
我一直试图使用
自动
绘图(在ggfortify
R
包中)来
绘制
PCA
坐标中
的
数
据点
。对于数据矩阵D2,在主成分1+2
的
空间内产生一个点
的
散点图很好。然而,
PCA
分量1+2只解释了大约30%
的
协方差,我想对
PCA
1+3、2+3和3+4等做同样
的
解释。自图中是否有一个简单
的
论点可以让我这
浏览 2
提问于2017-07-11
得票数 2
回答已采纳
1
回答
PCA
降维
、
我试图为文件中
的
所有SNP
绘制
一个VCF文件
的
三个
值
(QUAL、DP和分阶段速率)。
浏览 0
提问于2022-03-16
得票数 2
回答已采纳
1
回答
PCA
或主成分回归能揭示在单变量情况下看不到
的
信息吗?
、
我想知道是否有一种情况,你在主成分(PC)中看到
的
东西,你没有看到,通过单一地查看
的
变量,
PCA
是基于。我将在二维
设置
中使用一个例子来更好地说明我
的
问题:假设我们有两个组,A和B,对于每个观测,我们有两个多元-正态分布
的
协变量。,cbind.data.frame(group_B, group="B")) plot(dat[,1:2], xlab="x", ylab="y", col=dat[,"group"]
浏览 0
提问于2016-10-31
得票数 1
1
回答
使用晶格在
R
中为已处理
的
数据创建箱图
、
、
我正在尝试在一个非常大
的
数据集
的
R
中创建一个盒子图。包含数据
的
文件是2.5G,如果我试图导入它,它会崩溃
R
。幸运
的
是,其他一些(python)软件可以毫无问题地生成均值和方差,这就是我(目前)真正想要
绘制
的
。到目前为止,我找到
的
每个教程都需要你输入完整
的
数据集,然后
R
自己计算统计数据,但我想知道如何传递平均值、中位数、最小
值
、最大
值
等。bwplot仅用于绘图。我更
浏览 1
提问于2011-12-22
得票数 3
回答已采纳
2
回答
KMeans对
PCA
和
PCA
在KMeans上应用
的
区别
、
、
、
、
简短提问:长问题:在完成这个过程之后,我们希望在
R
3中可视化结果。我们可以用两种策略来解决这个问题; 策略1-对KMeans向量和主成分分析执行<em
浏览 0
提问于2018-10-21
得票数 1
1
回答
何时应用主成分分析
PCA
、
、
、
何时应用
PCA
,是在预处理(即删除空
值
、编码等)之后还是在此之前?x_train[:,0:14] = sc.fit_transform(x_train[:,0:14])我被留下
的
形状
浏览 2
提问于2021-10-14
得票数 0
2
回答
sklearn
PCA
.transform给出了不同试验
的
不同结果
、
、
我正在用sklearn.decomposition.
PCA
进行主成分分析,我发现如果输入矩阵X很大,两个不同
的
PCA
.transform实例
的
结果就不一样了。当X是1000x200或100x2000矩阵时,两个不同
的
PCA
实例
的
结果将不同。我不知道这是什么原因:我想在sklearn
的
PCA
求解器中没有随机元素?我使用
的
是滑雪版0.18.1。import numpy as np import sklearn.linea
浏览 1
提问于2018-01-05
得票数 1
回答已采纳
1
回答
主成分分析与异常数据
、
、
、
、
我知道
PCA
能很好地区分异常和正常数据,当它试图将数据转移到另一个维度时,它有助于区分异常和正常数据。我
的
意思是,它可以在某种程度上最大限度地分离规则和不规则
的
数
据点
。我也在我
的
密码里看到过这个。通过一个简单
的
详细例子(例如,一个简单
的
2*2矩阵)?有人能帮忙吗? 提前谢谢。
浏览 0
提问于2018-04-25
得票数 1
2
回答
K均值聚类前
的
主成分分析
、
、
、
、
如果我将
PCA
应用于特征向量,然后进行聚类,如下所示:kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10)减少
的
数据将是
PCA
的
组成部分,所以在用k均值聚类之后,您可以得到每个点(reduced_data)
的
标签,如何从原始数据中
浏览 0
提问于2017-02-27
得票数 4
2
回答
如何在进行
PCA
后
绘制
每个变量
的
主向量?
、
、
、
我
的
问题主要来自于这篇文章: 在本文中,作者
绘制
了每个变量
的
矢量方向和长度。
根据
我
的
理解,在进行
PCA
之后。我们得到
的
只是特征向量和特征
值
。对于维
数
M
的
数据集,每个特征
值
都应该是1xN
的
向量,所以,我
的
问题是,向量
的
长度可能是特征
值
,但是如何为每个变量找到向量
的
方向呢?向量长度
的
物理意义是什么
浏览 1
提问于2019-08-03
得票数 5
回答已采纳
3
回答
如何在2D平面上可视化4D数据?
、
我想在2D平面上可视化这样
的
4D数据。有没有办法做到这一点?
浏览 38
提问于2020-12-13
得票数 2
1
回答
根据
行/列
的
不同,标记ggplot中
的
每个第n个元素
、
、
我正在用
pca
.df( ggplot,t9)
绘制
PCA
数据,并试图标记我
的
数
据点
。有超过500个数
据点
就在一起,如果我把每一个数
据点
都贴上标签,标签就会变得很乱,所以我想每隔10或15个数
据点
就贴上标签。我试过使用gghighlight,但是我对ifelse语句
的
基本知识并没有给我带来任何解决方案。 我
的
(t9)代码如下所示。结果应该是一个分数/分数图,其中PC1和PC2
的
值</e
浏览 0
提问于2019-07-11
得票数 0
回答已采纳
1
回答
matplotlib修改
自动
缩放规则
打印时,matplotlib
根据
要打印
的
数据内容
自动
设置
比例。但似乎两个轴上
的
极限总是等于给定要
绘制
的
数据
的
最大
值
。它使达到最大
值
的
数据
的
标记被复制。我想改变这个行为,这样无论标记
的
大小
如何,它都会在图
的
四边留出一些空间。至少,有没有一种方法可以简单地
设置
静态
的
、用户定义
的
边
浏览 0
提问于2013-04-15
得票数 1
回答已采纳
2
回答
大型数据集
的
绘图代表样本- Matlab
、
、
我有一个包含两个数组
的
大型数据集,比如x和y。这些数组
的
大小
超过100万个数
据点
。有没有一种简单
的
方法来
绘制
只有2000个这样
的
点
的
散点图,但它必须代表整个集合?我正在考虑创建另一个数组
r
;
r
= max(x)*rand(2000,1)来获取x数组
的
随机样本。有没有办法找到
r
中
的
值
等于或接近x中
的
值
的<
浏览 2
提问于2013-10-31
得票数 0
1
回答
基本分类问题
、
、
、
我想知道如何在使用
PCA
或规范化以及其他类似于分类
的
方法来管理测试数据,因为我们
的
模型工作在输入向量
的
表示上。例如,假设您在您
的
训练数据集中使用了
PCA
以获得更高
的
精度,或者您已经标准化(最小-最大)数据。现在,您已经开发了一个模型,并希望安装它并标记新
的
示例。您需要以某种方式将
PCA
应用于每个即将到来
的
记录,并将该记录规范化。将
PCA
应用于一个记录不会产生与训练阶段使用
的
浏览 0
提问于2018-04-18
得票数 2
回答已采纳
1
回答
和其他超参数一样,尝试找到最佳
的
PCA
k参数可以吗?
、
、
在机器学习中,采用主成分分析(
PCA
)将n维数据降为k维数据,以加快学习速度。应用
PCA
后,可以检查原始数据集
的
方差在结果数据集中仍有多少。一个共同
的
目标是保持90%到99%之间
的
差异。我
的
问题是:尝试k参数
的
不同
值
(结果数据集
的
维
数
的
大小
),然后
根据
一些交叉验证数据集检查结果,就像我们选择正则化、lambdas和阈值等其他超参数
的
好
值<
浏览 0
提问于2019-03-27
得票数 8
1
回答
难以理解
PCA
是如何实现图像压缩和降维
的
、
、
让我们取X
的
维
数
为n,现在,在计算了经济SVD之后,如果我们只保留第一个
r
(<< m )奇异
值
,则X
的
逼近是 X' = σ1.u1.v1(T) + σ2.u2.v2(T) + ... + σ
r
.ur.vr是不是因为我们必须存储
r
(每个u
的
长度28 )+28(每v
的
长度)像素,而不是存储784百万像素
值
?或者还有更多
的
东西吗?我
的
第二个问题是,如果我试图用数值
浏览 5
提问于2021-08-04
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【视频】主成分分析PCA降维方法和R语言分析葡萄酒可视化实例|数据分享
4种SVM主要核函数及相关参数的比较
比PCA降维更高级——t-SNE聚类算法实践指南
R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图
实战指南:Scikit-Learn中的PCA算法轻松上手
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券