Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >计算两个以上变量的相关性?

计算两个以上变量的相关性?
EN

Stack Overflow用户
提问于 2011-03-27 00:42:28
回答 5查看 141.9K关注 0票数 32

我使用以下方法来计算我的数据集的相关性:

代码语言:javascript
运行
AI代码解释
复制
cor( var1, var2, method = "method")

但我喜欢创建一个包含4个不同变量的相关矩阵。做这件事最简单的方法是什么?

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2011-03-27 00:50:21

在数据帧上使用相同的函数(cor),例如:

代码语言:javascript
运行
AI代码解释
复制
> cor(VADeaths)
             Rural Male Rural Female Urban Male Urban Female
Rural Male    1.0000000    0.9979869  0.9841907    0.9934646
Rural Female  0.9979869    1.0000000  0.9739053    0.9867310
Urban Male    0.9841907    0.9739053  1.0000000    0.9918262
Urban Female  0.9934646    0.9867310  0.9918262    1.0000000

或者,在也包含离散变量(有时也称为因子)的数据框上,尝试如下所示:

代码语言:javascript
运行
AI代码解释
复制
> cor(mtcars[,unlist(lapply(mtcars, is.numeric))])
            mpg        cyl       disp         hp        drat         wt        qsec         vs          am       gear        carb
mpg   1.0000000 -0.8521620 -0.8475514 -0.7761684  0.68117191 -0.8676594  0.41868403  0.6640389  0.59983243  0.4802848 -0.55092507
cyl  -0.8521620  1.0000000  0.9020329  0.8324475 -0.69993811  0.7824958 -0.59124207 -0.8108118 -0.52260705 -0.4926866  0.52698829
disp -0.8475514  0.9020329  1.0000000  0.7909486 -0.71021393  0.8879799 -0.43369788 -0.7104159 -0.59122704 -0.5555692  0.39497686
hp   -0.7761684  0.8324475  0.7909486  1.0000000 -0.44875912  0.6587479 -0.70822339 -0.7230967 -0.24320426 -0.1257043  0.74981247
drat  0.6811719 -0.6999381 -0.7102139 -0.4487591  1.00000000 -0.7124406  0.09120476  0.4402785  0.71271113  0.6996101 -0.09078980
wt   -0.8676594  0.7824958  0.8879799  0.6587479 -0.71244065  1.0000000 -0.17471588 -0.5549157 -0.69249526 -0.5832870  0.42760594
qsec  0.4186840 -0.5912421 -0.4336979 -0.7082234  0.09120476 -0.1747159  1.00000000  0.7445354 -0.22986086 -0.2126822 -0.65624923
vs    0.6640389 -0.8108118 -0.7104159 -0.7230967  0.44027846 -0.5549157  0.74453544  1.0000000  0.16834512  0.2060233 -0.56960714
am    0.5998324 -0.5226070 -0.5912270 -0.2432043  0.71271113 -0.6924953 -0.22986086  0.1683451  1.00000000  0.7940588  0.05753435
gear  0.4802848 -0.4926866 -0.5555692 -0.1257043  0.69961013 -0.5832870 -0.21268223  0.2060233  0.79405876  1.0000000  0.27407284
carb -0.5509251  0.5269883  0.3949769  0.7498125 -0.09078980  0.4276059 -0.65624923 -0.5696071  0.05753435  0.2740728  1.00000000
票数 41
EN

Stack Overflow用户

发布于 2016-07-29 13:17:27

如果您想要将矩阵与一些可视化相结合,我可以推荐(我正在使用内置的iris数据集):

代码语言:javascript
运行
AI代码解释
复制
library(psych)
pairs.panels(iris[1:4])  # select columns 1-4

Performance Analytics基本上做了同样的事情,但默认情况下包括重要性指标。

代码语言:javascript
运行
AI代码解释
复制
library(PerformanceAnalytics)
chart.Correlation(iris[1:4])

或者这个漂亮而简单的可视化:

代码语言:javascript
运行
AI代码解释
复制
library(corrplot)
x <- cor(iris[1:4])
corrplot(x, type="upper", order="hclust")

票数 21
EN

Stack Overflow用户

发布于 2011-03-27 01:27:01

参见psych包中的corr.test函数:

代码语言:javascript
运行
AI代码解释
复制
> corr.test(mtcars[1:4])
Call:corr.test(x = mtcars[1:4])
Correlation matrix 
       mpg   cyl  disp    hp
mpg   1.00 -0.85 -0.85 -0.78
cyl  -0.85  1.00  0.90  0.83
disp -0.85  0.90  1.00  0.79
hp   -0.78  0.83  0.79  1.00
Sample Size 
     mpg cyl disp hp
mpg   32  32   32 32
cyl   32  32   32 32
disp  32  32   32 32
hp    32  32   32 32
Probability value 
     mpg cyl disp hp
mpg    0   0    0  0
cyl    0   0    0  0
disp   0   0    0  0
hp     0   0    0  0

又一次无耻的自我宣传:https://gist.github.com/887249

票数 11
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5446426

复制
相关文章
二分类变量相关性分析spss_两个有序分类变量相关性的卡方检验-SPSS教程
研究者想探索类风湿关节炎躯体感觉的症状数量与疼痛等级之间的关系,从一家大型医院入院治疗的类风湿关节炎病人中随机招募了364例研究对象。类风湿关节炎躯体感觉共有6种症状,研究者请研究对象报告其患有症状。类风湿关节炎门诊的医生使用疼痛量表对每个研究对象的疼痛进行评级。研究对象自报的类风湿关节炎躯体感觉症状数量在1-6个之间,为有序分类变量,变量名为symptoms。医生将研究对象的疼痛分为四级:1级(轻度影响生活,轻度疼痛)、2级(轻度影响生活,高度疼痛)、3级(高度影响生活,疼痛致行为中度受限)和4级(高度影响生活,疼痛致行为重度受限),变量名为pain。部分数据如图1。
全栈程序员站长
2022/08/29
8250
入门 | 从PCC到MIC,一文教你如何计算变量之间的相关性
选自FreeCoderCamp 作者:Peter Gleeson 机器之心编译 参与:陈韵竹、程耀彤、刘晓坤 本文介绍了几个重要的变量相关性的度量,包括皮尔逊相关系数、距离相关性和最大信息系数等,并用简单的代码和示例数据展示了这些度量的适用性对比。 从信号的角度来看,这个世界是一个嘈杂的地方。为了弄清楚所有的事情,我们必须有选择地把注意力集中到有用的信息上。 通过数百万年的自然选择过程,我们人类已经变得非常擅长过滤背景信号。我们学会将特定的信号与特定的事件联系起来。 例如,假设你正在繁忙的办公室中打乒乓球
机器之心
2018/05/08
4.1K0
入门 | 从PCC到MIC,一文教你如何计算变量之间的相关性
计算MiRNA–mRNA表达相关性
使用 Maximal Information Coefficient (MIC) 这个算法来计算计算MiRNA–mRNA表达相关性,这个算法来自于文献:D. N. et al. Detecting novel associations in large data sets. Science 334, 1518–1524 (2011).
生信技能树
2018/12/18
1.5K0
交换两个变量
问:有变量 a 和 b,将 a 和 b 的值调换 # 解法1:使用其他变量 c c = a a = b b = c # 解法2:不使用其他变量 a = a + b b = a - b a = a - b # 解法3:拆包(python特有的方法) a, b = (b, a) a, b = b, a  # =右边实质是元组
py3study
2020/01/17
9180
随机变量的相关性与独立性
语义上来讲,独立是指变量之间完全没有关系,但是不相关则仅要求变量之间没有线性关系,因而独立的要求更高,独立的变量一定是不相关的,但是不相关的不一定是独立的,即独立是不相关的充分不必要条件。
yangzelong
2019/03/26
3.1K0
随机变量的相关性与独立性
Java交还两个变量的值
package com.binbin.test; public class SwitchVariable { public static void main(String[] args) { Data data = new Data(); data.m = 10; data.n = 20; System.out.println("m = " + data.m + ",n = " + data.n); System.out.println("++++++++++没有交换之前+++++
Linuxcc
2022/02/04
9920
Python交换两个变量的值
首先,来回顾一下C语言中交换两个数字的三种方法,最简单的方式也需要一个中间人来暂存其中某一个值。但是在python下,这个操作会异常的简单。
zy010101
2021/06/09
1.5K0
php中有两个美元符号$$的变量——可变变量
以上代码的第二句,我们是用两个美元符号的变量,那么在这里这个变量是我们可变变量。我以下从第一句开始详细解释:
1_bit
2021/01/14
2.3K0
php不使用中间变量交换两个变量的值
这就是位运算带给我们的奇妙之处!(这种方法只适合于int型和string型,而且位数不能超过8位)
老高的技术博客
2022/12/27
1.4K0
特征锦囊:如何根据变量相关性画出热力图?
上次的锦囊有提及到如何使用sklearn来实现多项式的扩展来衍生更多的变量,但是我们也知道其实这样子出来的变量之间的相关性是很强的,我们怎么可以可视化一下呢?这里介绍一个热力图的方式,调用corr来实现变量相关性的计算,同时热力图,颜色越深的话,代表相关性越强!
Sam Gor
2020/02/17
2K0
特征锦囊:如何根据变量相关性画出热力图?
R平方/相关性取决于预测变量的方差
在我今天参与的一个讨论中,提出了一个问题,即在具有单个连续预测器的线性回归模型中R平方如何/是否取决于预测变量的方差。这个问题的答案当然是肯定的。
拓端
2020/07/17
6230
R平方/相关性取决于预测变量的方差
使用R优雅的批量计算相关性
❝本节来介绍如何通过R来批量做相关性分析,将通过两个小例子来进行介绍,1个for循环与另一个tidyverse体系; 加载R包 library(tidyverse) library(magrittr) library(ggstatsplot) 案例一 导入数据 Bats <- read.csv(file = "Bats_data.csv", header = T, stringsAsFactors = F) Bats_subset <- select(Bats, Activity, Area.thin
R语言数据分析指南
2022/09/21
1.6K0
使用R优雅的批量计算相关性
R计算mRNA和lncRNA之间的相关性+散点图
我们在做表达谱数据分析的时候,经常需要检测基因两两之间表达的相关性。特别是在构建ceRNA网络的时候,我们需要去检查构成一对ceRNA的mRNA和lncRNA之间的表达是否呈正相关。前面给大家分享过R计算多个向量两两之间相关性,今天小编就给大家分享一个实际的应用案例,用R去批量的检测大量mRNA跟lncRNA之间表达的相关性,并绘制散点图。
生信交流平台
2022/09/21
8740
R计算mRNA和lncRNA之间的相关性+散点图
swap()交换两个变量的方法汇总
借助第三方变量 //借助temp变量 public static void swap(int arr[],int i,int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; } 数学表达式 public static void swap(int[] arr, int i, int j) { arr[i] = arr[i] + arr[j]; arr[j] = arr[i] - a
sr
2018/08/20
6370
计算两个数的和算法
给定一个整数数组 nums 和一个整数 target ,找到数组里的两个数的和等于 target,返回这两个数在数组中的下标,假设每个输入都只有一个解决方案,并且不能两次使用相同的元素。可以按任何顺序返回答案。
玖柒的小窝
2021/12/14
6390
不借助变量交换两个数
我们在平时写代码的过程之中,竟然会有交换两个变量值的需求。然而我们大多数还是会采用借助额外变量的方式,因为这种方式不仅简单,容易理解,可读性高, 更重要的是适用范围广。那么今天我们来研究一下《如何不借助变量交换两个数》。
lucifer210
2019/08/28
8820
不借助变量交换两个数
两个常用静态变量
常量名称 常量用途 pathSeparator 路径分割符 separator 文件分割符 例: package cn.hxh.io.file; import java.io.File; public class Demo01 { public static void main(String[] args) { // TODO Auto-generated method stub System.out.println(File.pathSeparator);
shimeath
2020/07/30
5310
JavaScript两个变量交换值(不使用临时变量)
本文主要描述,如何不使用中间值,将两个变量的值进行交换。  前三种只适用于number类型的数值交换,第四和第五种适合其他类型。
我是leon
2019/08/28
1.7K0
计算两个日期中间的天数_excel两个日期相减计算天数
内存限制: 65536kB 描述
全栈程序员站长
2022/09/20
2.9K0
基于点击图模型Query和Document相关性的计算
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
张凝可
2019/08/22
1.6K0
基于点击图模型Query和Document相关性的计算

相似问题

计算相似性百分比或计算两个以上对象之间的相关性

694

计算解释变量之间的相关性

10

如何计算Python中两个范畴变量之间的相关性?

18

使用@变量计算相关性

11

如何使用MapReduce计算python中两个变量之间的相关性

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档