我有一个数据集,我想选择VIF(方差膨胀因子)小于某个阈值的变量子集。我的想法是计算每个变量的VIF,然后取出最高值的变量(如果它高于某个阈值),重新计算每个剩余变量的VIF,并重复该过程,直到没有VIF高于treshold。这种方法没有什么新奇的想法,但是我无法在Python中创建一个函数来自动化这个过程。variance_inflation_factor
from statsmodels.tools.tools
我有:StatsModel0.5.0(正式名为scikits.statsmodels)熊猫0.12.0。(全部安装自源) File "/home/username/.local/python27/lib/python2.7/site-packages/pandas-0.12.0-py2.7-linux-x86_64.egg/pandas/stats/ols.py", line 53, in