我刚刚在包含7个自变量和1个目标变量的数据集上运行了一个线性回归模型。下面是R平方和MSE值。
有人能给我一些建议来提高这个型号的效率吗?
编辑:我刚刚实现了同样的问题,使用线性回归和归一化的特性。我得到了以下输出:训练集的均方误差: 5.468490570335696e-10训练集的R2值: 0.9275088299658416训练集的均方误差: 4.111793316375822e-10训练集的R2值: 0.9342888671422529。
那么,我们能考虑标准化数据集以获得更好的准确性吗?
发布于 2018-04-18 17:20:34
发布于 2018-04-18 19:04:51
多元共线性可能是线性回归模型性能较差的原因之一。多重共线性是指线性回归模型中的多个自变量相互密切相关,从而导致结果偏差的情况。一般情况下,多元共线性会导致自变量的置信区间更宽,概率值更不可靠。也许其他线性回归的假设不成立。线性回归需要自变量和因变量之间的关系是线性的。由于线性回归对异常值的影响很敏感,所以检验异常值也是很重要的。线性假设最好用散点图来检验。线性回归分析要求数据中几乎没有或根本没有自相关。当残差不相互独立时,就会发生自相关。
https://datascience.stackexchange.com/questions/30465
复制相似问题