-方差膨胀系数(VIF)
1、✌ 原理:
方差膨胀系数是衡量多元线性回归模型中多重共线性严重程度的一种度量。...它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。
2、✌ 多重共线性:
是指各特征之间存在线性相关关系,即一个特征可以是其他一个或几个特征的线性组合。...例如:
x1=[1,2,3,4,5]
x2=[2,4,6,8,10]
x3=[2,3,4,5,6]
# x2=x1*2
# x3=x1+1
上述x2,x3都和x1成线性关系,这会进行回归时,影响系数的准确性...from sklearn.linear_model import LogisticRegression
# AUC和准确度
from sklearn.metrics import accuracy_score...0.8194
删除账户资金 0.7821 0.8149
删除累计交易佣金 0.7586 0.7272
我们可以看出当我们删除账户资金这列特征时,分数有所上升,而AUC值下降了一点,不过影响不大,那么删除了共线性的特征是对我们模型的准确性是有作用的