导读:相关性分析在量化分析、行业分析、机器学习等领域都有着普遍的应用,本文将围绕相关性分析的定义、相关性系数等重点知识展开介绍,更多数据分析干货可点击数据分析方法论(干货)。
1、什么是相关性分析
2、相关性系数
import scipy.stats x = [1, 2, 3, 4, 5, 6, 7, 8, 9] y = [2, 1, 2, 4.5, 7, 6.5, 6, 9, 9.5] pearson_corr = scipy.stats.pearsonr(x, y)[0] #或pandas中用data.corr(),data为数据框
import scipy.stats x = [1, 2, 3, 4, 5, 6, 7, 8, 9] y = [2, 1, 2, 4.5, 7, 6.5, 6, 9, 9.5] pearson_corr = scipy.stats.spearmanr(x, y)[0] #或pandas中用data.corr('spearman'),data为数据框
3、相关性系数两个维度
相关系数取值一般在-1~1之间,可从如下两个维度进行解读:
4、学习卡
下图对相关性分析方法重点内容进行了罗列,可保存到相册随时查看。
参考材料:
https://zhuanlan.zhihu.com/p/36441826
https://www.sohu.com/a/445463180_114819