首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >改进线性回归模型的技巧

改进线性回归模型的技巧
EN

Data Science用户
提问于 2018-04-18 07:04:30
回答 2查看 33.7K关注 0票数 3

我刚刚在包含7个自变量和1个目标变量的数据集上运行了一个线性回归模型。下面是R平方和MSE值。

  • 训练集的均方误差: 36530921.0123
  • 训练集的$R^2$值: 0.7477

有人能给我一些建议来提高这个型号的效率吗?

编辑:我刚刚实现了同样的问题,使用线性回归和归一化的特性。我得到了以下输出:训练集的均方误差: 5.468490570335696e-10训练集的R2值: 0.9275088299658416训练集的均方误差: 4.111793316375822e-10训练集的R2值: 0.9342888671422529。

那么,我们能考虑标准化数据集以获得更好的准确性吗?

EN

回答 2

Data Science用户

回答已采纳

发布于 2018-04-18 17:20:34

您可以构建更复杂的模型来尝试捕获剩余的差异。以下是几种选择:

  • 添加相互作用项
  • 添加多项式项来模拟自变量与目标变量之间的非线性关系
  • 脊骨添加到近似分段线性模型中
  • 适合等渗回归以删除目标函数形式的任何假设
  • 拟合非参数模型,如火星
票数 6
EN

Data Science用户

发布于 2018-04-18 19:04:51

多元共线性可能是线性回归模型性能较差的原因之一。多重共线性是指线性回归模型中的多个自变量相互密切相关,从而导致结果偏差的情况。一般情况下,多元共线性会导致自变量的置信区间更宽,概率值更不可靠。也许其他线性回归的假设不成立。线性回归需要自变量和因变量之间的关系是线性的。由于线性回归对异常值的影响很敏感,所以检验异常值也是很重要的。线性假设最好用散点图来检验。线性回归分析要求数据中几乎没有或根本没有自相关。当残差不相互独立时,就会发生自相关。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/30465

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档