• PCR是处理许多 x 变量的回归技术
• 给定 Y 和 X 数据:
• 在 X 矩阵上进行 PCA
– 定义新变量:主成分(分数)
• 在 多元线性_回归_(_MLR_) 中使用这些新变量中的一些来建模/预测 Y
• Y 可能是单变量或多变量。
相关视频
例子
# 对数据
set.seed(123)
da1
多元线性回归和逐步剔除变量,手动:
# 对于data1:(正确的顺序将根据模拟情况而改变)。
lm(y ~ x1 + x2 + x3 + x4)
lm(y ~ x2 + x3 + x4)
lm(y ~ x2 + x3)
lm(y ~ x3)
配对关系图
pais(atix, ncol = 5, byrow = F
如果对data2重复以上过程:
# 对于data2:
lm(y ~ x1 + x2 + x3 + x4)
lm(y ~ x1 + x2 + x4)
lm(y ~ x2 + x4)
lm(y ~ x2)
数据集 2 的绘图:
使用四个 x 的均值作为单个变量来分析两个数据集:
xn1
lm(data1\[,5\] ~ xn1)
lm(data2\[,5\] ~ xn2)
检查一下X数据的PCA的载荷loading是什么。
# 几乎所有的方差都在第一主成分解释。
prnmp(dt1\[,1:4\])
# 第一个成分的载荷
picp(dta1\[,1:4\])$lads\[,1\]
它们几乎相同,以至于第一个主成分本质上是四个变量的平均值。让我们保存一些预测的 beta 系数 - 一组来自数据 1 的完整集和一组来自均值分析的:
c1
dt1\[,4\]))$coficns\[,1\]
f
我们现在模拟三种方法(完整模型、均值(=PCR)和单个变量)在 7000 次预测中的表现:
# 对预测进行模拟。
误差
xn
yt2
yht3
bro(c(um((y-hat)^2)/7000 min = "平均预测误差平方")
PCR 分析误差最小。
示例:光谱类型数据
构建一些人工光谱数据:(7 个观测值,100 个波长)
# 光谱数据实例
mapot(t(spcra) )
mtlnes(t(spcra))
平均光谱表明:
mtpot(t(secra))
malies(t(spcta))
mnp
lines(1:100, mnp, lwd = 2)
平均中心光谱:
spcamc
plot(t(spermc),tpe="")
领取专属 10元无门槛券
私享最新 技术干货