前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >因子分析与主成分分析之间爱恨离愁。FA与FCA

因子分析与主成分分析之间爱恨离愁。FA与FCA

作者头像
学到老
发布于 2018-03-16 06:26:33
发布于 2018-03-16 06:26:33
2.6K0
举报

主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。

1.原理不同

主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。

因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。就是要从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)

2.线性表示方向不同

因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。

3.假设条件不同

主成分分析:不需要有假设(assumptions),

因子分析:需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4.求解方法不同

求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。

(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)

  注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。此外,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题(会出现最小特征根接近0的情况);

求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。

5.主成分和因子的变化不同

主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;

因子分析:因子不是固定的,可以旋转得到不同的因子。

6.因子数量与主成分的数量

主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。

因子分析:因子个数需要分析者指定(SPSS和sas根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;

7.解释重点不同:

主成分分析:重点在于解释个变量的总方差,

因子分析:则把重点放在解释各变量之间的协方差。

8.算法上的不同: 主成分分析:协方差矩阵的对角元素是变量的方差;

因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)

9.优点不同:

因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;

主成分分析:

   第一:如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析;

   第二:通过计算综合主成分函数得分,对客观经济现象进行科学评价;

   第三:它在应用上侧重于信息贡献影响力综合评价。

   第四:应用范围广,主成分分析不要求数据来自正态分布总体,其技术来源是矩阵运算的技术以及矩阵对角化和矩阵的谱分解技术,因而凡是涉及多维度问题,都可以应用主成分降维;

10.应用场景不同:

主成分分析:

   可以用于系统运营状态做出评估,一般是将多个指标综合成一个变量,即将多维问题降维至一维,这样才能方便排序评估;

   此外还可以应用于经济效益、经济发展水平、经济发展竞争力、生活水平、生活质量的评价研究上;

主成分还可以用于和回归分析相结合,进行主成分回归分析,甚至可以利用主成分分析进行挑选变量,选择少数变量再进行进一步的研究。

   一般情况下主成分用于探索性分析,很少单独使用,用主成分来分析数据,可以让我们对数据有一个大致的了解。

  几个常用组合:

主成分分析+判别分析,适用于变量多而记录数不多的情况;

主成分分析+多元回归分析,主成分分析可以帮助判断是否存在共线性,并用于处理共线性问题;

主成分分析+聚类分析,不过这种组合因子分析可以更好的发挥优势。

因子分析:

  首先,因子分析+多元回归分析,可以利用因子分析解决共线性问题;

  其次,可以利用因子分析,寻找变量之间的潜在结构;

  再次,因子分析+聚类分析,可以通过因子分析寻找聚类变量,从而简化聚类变量;

   此外,因子分析还可以用于内在结构证实

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
数据分析方法——因子分析
1 问题 之前我们考虑的训练数据中样例 的个数m都远远大于其特征个数n,这样不管是进行回归、聚类等都没有太大的问题。然而当训练样例个数m太小,甚至m<<n的时候,使用梯度下降法进行回归时,如果初
机器学习AI算法工程
2018/03/12
2.2K0
数据分析方法——因子分析
主成分分析和因子分析在SPSS中的实现
(一)、因子分析在SPSS中的实现 进行因子分析主要步骤如下: 1.  指标数据标准化(SPSS软件自动执行); 2.  指标之间的相关性判定; 3.  确定因子个数; 4.  综合得分表达式; 5.  各因子Fi命名; 例子:对沿海10个省市经济综合指标进行因子分析 (一)指标选取原则   本文所选取的数据来自《中国统计年鉴2003》中2002年的统计数据,在沿海10省市经济状况主要指标体系中选取了10个指标: X1——GDP       X2——人均GDP X3——农业增加值    X4——工业
机器学习AI算法工程
2018/03/12
4.3K0
主成分分析和因子分析在SPSS中的实现
主成分分析与因子分析及SPSS实现[通俗易懂]
在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。比如为了研究某种疾病的影响因素,我们可能会收集患者的人口学资料、病史、体征、化验检查等等数十项指标。如果将这些指标直接纳入多元统计分析,不仅会使模型变得复杂不稳定,而且还有可能因为变量之间的多重共线性引起较大的误差。有没有一种办法能对信息进行浓缩,减少变量的个数,同时消除多重共线性?
全栈程序员站长
2022/08/30
5.2K0
主成分分析与因子分析及SPSS实现[通俗易懂]
一文带你详细了解因子分析(长文预警)
因子分析是一种描述原始变量或原始样本之间相关关系的一种手段,所谓因子指的是多个错综复杂的自变量经过有效手段抽取到少数几个综合计算变量的代称,它是一种多变量统计分析方法,通过因子得分确定较高得分的公共因子载荷矩阵进行对原始变量的代替(相当于降维),出发点是原始变量的相关系数矩阵
用户7506105
2021/08/09
4.2K0
因子分析
目录: 什么是因子分析 因子分析的作用 因子分析模型 因子分析的统计特征 因子载荷矩阵的估计方法 因子旋转 为什么要做因子旋转 因子旋转方法 因子得分 因子分析步骤 举例 因子分析和主成分分析区别 1、什么是因子分析? 因子分析是一种数据简化技术。 它通过研究众多变量间的依赖关系,探求观测数据中的基本数据结构,并且用少数几个假象变量(因子)来表示其基本数据结构; 这几个假想变量(因子)可以表示原来众多的原始变量的主要信息; 原始变量是可观测的显在变量,而假想变量是不可观测的潜在变量,即因子; 即一种用来在
Echo_fy
2018/06/21
1.2K0
多元统计分析:主成分分析
长途电话通话时长 决定, 这5个指标是总量指标,说明一个城市的电信业务规模和电信通信业务发展水平
yiyun
2022/04/01
1.5K0
多元统计分析:主成分分析
【机器学习】--主成分分析PCA降维从初识到应用
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
LhWorld哥陪你聊算法
2018/09/13
1.7K0
【机器学习】--主成分分析PCA降维从初识到应用
R语言实现主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。 1.R中的主成分和因子分析 R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal() psych包中有用的因子分析函数 函数描述 principal()含多种可选的方差放置方法的主成分分析fa()可用主轴、最小残差、加权最
机器学习AI算法工程
2018/03/14
2.5K0
R语言实现主成分和因子分析
R语言主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。 1.R中的主成分和因子分析 R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal() psych包中有用的因子分析函数 函数描述 principal()含多种可选的方差放置方法的主成分分析fa()可用主轴、最小残差、加权
机器学习AI算法工程
2018/03/13
2.7K0
R语言主成分和因子分析
主成分分析详解_pca主成分分析贡献率
上完陈恩红老师的《机器学习与知识发现》和季海波老师的《矩阵代数》两门课之后,颇有体会。最近在做主成分分析和奇异值分解方面的项目,所以记录一下心得体会。
全栈程序员站长
2022/11/16
2.8K0
主成分分析详解_pca主成分分析贡献率
抓住主要信息,线性降维的技术——PCA
随着通信技术、计算能力、数据采集等领域的发展成熟,企业积累了大量的数据,这里的“大量”体现在数据的条数多,海量的数据,同时也体现在维度、字段上的多;面对大量字段,数据分析师在建立模型时,除了会面临字段理解上的困难(数量多,内容多),若不事先预处理就把全部特征纳入模型,那只会“垃圾进垃圾出”,除了给模型增加复杂度,带来过拟合的风险,其他作用微乎其微;
CDA数据分析师
2021/12/27
5680
抓住主要信息,线性降维的技术——PCA
主成分分析①
principal() 含多种可选的方差旋转方法的主成分分析 fa() 可用主轴、最小残差、加权最小平方或最大似然法估计的因子分析 fa.parallel() 含平行分析的碎石图 factor.plot() 绘制因子分析或主成分分析的结果 fa.diagram() 绘制因子分析或主成分的载荷矩阵 scree() 因子分析和主成分分析的碎石图
用户1359560
2018/08/27
8811
(数据科学学习手札20)主成分分析原理推导&Python自编函数实现
主成分分析(principal component analysis,简称PCA)是一种经典且简单的机器学习算法,其主要目的是用较少的变量去解释原来资料中的大部分变异,期望能将现有的众多相关性很高的变量转化为彼此互相独立的变量,并从中选取少于原始变量数目且能解释大部分资料变异情况的若干新变量,达到降维的目的,下面我们先对PCA算法的思想和原理进行推导: 主成分即为我们通过原始变量的线性组合得到的新变量,这里假设xi(i=1,2,...,p)为原始变量,yi(i=1,2,...,p)为主成分,他们之间的关系
Feffery
2018/04/17
9700
(数据科学学习手札20)主成分分析原理推导&Python自编函数实现
商业决策中如何快速找到问题关键?变量降维算法详解
本周我们将告诉你如何快速找到矩阵分析中那2个关键维度——变量降维算法。下面介绍两种常用的降维方式:主成分分析法和因子分析法,并对比说明二者的联系与区别。
CDA数据分析师
2021/12/04
8670
商业决策中如何快速找到问题关键?变量降维算法详解
PCA主成分析原理、理解和代码实现
请注意,本文编写于 381 天前,最后修改于 67 天前,其中某些信息可能已经过时。
曼亚灿
2023/05/17
9780
PCA主成分析原理、理解和代码实现
机器学习|主成分分析(PCA)
在我们机器学习所训练的数据中,通常会存在着很多的特征,这也就意味着我们所要处理的数据的维度是很大的,由于维度大的数据处理起来非常困难,各种各样的降维算法也就随之产生了。
数据山谷
2020/07/21
1.3K0
机器学习|主成分分析(PCA)
理论:因子分析原理剖析
F1,F2,F3...为前m个因子包含数据总量(累计贡献率)不低于80%。可取前m各因子来反映原评价
sladesal
2018/08/27
2.2K0
理论:因子分析原理剖析
R语言之主成分分析-PCA 贡献率
1、关键点 综述:主成分分析 因子分析典型相关分析,三种方法的共同点主要是用来对数据降维处理的 从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。 #主成分分析 是将多指标化为少数几个综合指标的一种统计分析方法 主成分分析是一种通过降维技术把多个变量化成少数几个主成分的方法,这些主成分能够反映原始变量的大部分信息,他们通常表示为原始变量的线性组合。 2、函数总结 #R中作为主成分分析最主要的函数是princomp()函数 #princomp()主成分分析 可以从相关阵或者从协方差阵做主成分分析
学到老
2018/03/16
3.1K0
R in action读书笔记(19)第十四章 主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。
统计学家
2019/04/10
1K0
R in action读书笔记(19)第十四章 主成分和因子分析
R语言数据分析与挖掘(第六章):主成分分析(2)——案例讲解
na.action:一个函数,指定缺失数据的处理方法,若为NULL,则使用函数na.omit()删除缺失数据。
DoubleHelix
2019/12/16
3.7K0
相关推荐
数据分析方法——因子分析
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档