腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
R
:
删除
/
删除
多个
共线
变量
,
基于
多个
共线
测试
输出
的
输出
、
我有一个包含32个
变量
和48个观察值
的
数据集(观察值将会增加,因为我们正处于通过订阅收集数据
的
阶段)。由于数据集具有高度
的
多重
共线
性,因此我引入了Farrar - Glauber
测试
。
测试
的
单个度量(idiags)有一个名为Klein
的
参数,该参数
的
值为0和1s,表示
变量
是否存在多重
共线
性。现在,根据Klien
的
值,我需要从主数据集中
删除
列。<e
浏览 65
提问于2018-07-29
得票数 0
1
回答
有没有一种快速检查
R
中
的
范畴
变量
之间多重
共线
性
的
方法?
、
、
我有大量
的
分类
变量
和虚拟
变量
(36),我想根据它们
的
多重
共线
性(或者仅仅是
共线
性)来
删除
其中
的
一些
变量
。与其一次又一次地使用X平方
测试
,是否有任何函数可以检查我
的
变量
中
的
(多)
共线
性,以及返回具有多重
共线
性(或
共线
性)
的
变量
?
浏览 0
提问于2018-04-15
得票数 1
回答已采纳
3
回答
相关性与多重
共线
性
、
、
、
我也有几个问题要问:
删除
变量
是唯一
的
解决方案?我在一次采访中被问到,如果我们
删除
了一个相关
变量
,那么这种多重
共线
性是如何产生
的
呢?因为pa
浏览 0
提问于2019-08-07
得票数 6
1
回答
建立具有多(8)个预测
变量
的
负二项GLMM
我是
R
的
新手,我正在尝试使用负二项GLMM创建模型。问题是,我有一个响应
变量
,我想
测试
8个预测
变量
的
多重
共线
性。例如,当只有3个预测
变量
时,这似乎很容易,因为这意味着只有4种可能
的
组合。然而,我想知道在
测试
多重
共线
性时,是否有一种更容易
的
方法来为8个不同
的
预测
变量
设置所有可能
的
组合,而不是手动检查每个组合,这意味着要针对响应<e
浏览 14
提问于2021-04-21
得票数 1
1
回答
测试
集上存在不可见数据
的
OneHotEncoding问题
、
、
、
我有包含数值
变量
和分类
变量
的
数据。我把数据分成了训练和
测试
。我想在填充之后做一次热编码。
测试
集上有不可见
的
数据。 我知道handle_unknown='ignore'解决了这个问题。但是,我也想
删除
一列(drop='first'),以避免多重
共线
性。OnehotEncoding不能同时采用这两种方法。 有没有办法既能处理看不见
的
数据,又能避免多重
共线
性?注意:我使用
的<
浏览 27
提问于2021-05-04
得票数 0
1
回答
python中如何从
多个
自
变量
和一个因
变量
绘制图[多元线性回归]
、
、
、
我是机器学习
的
新手,面临着在多元线性回归中如何去除
多个
自
变量
的
问题。我所经历
的
步骤: 1)读取数据集2)分离成X和Y)将分类数据编码为数据集包含列:教授、职称、专业等。4)去除虚拟
变量
5)OLS回归结果。 我有7个自
变量
,OLS后有6个独立variables.Removed,P> 0.05,P值大于0.0 5
的
显着性水平。您能建议哪些步骤来绘制图形,并
删除
图像中附加
的
所有不必要
的
自
变量
浏览 3
提问于2018-11-13
得票数 0
1
回答
面板数据
R
中多重
共线
性
的
检验
、
、
、
我正在使用
R
中
的
plm包运行面板数据回归,并希望控制解释
变量
之间
的
多重
共线
性。有没有一种方法可以计算类似于vif
的
测试
,或者我可以只将每个
变量
视为时间序列,省略面板信息并使用car包运行
测试
?我使用<em
浏览 1
提问于2013-11-29
得票数 8
回答已采纳
3
回答
多重
共线
性如何影响神经网络?
、
多重
共线
性是线性回归
的
一个问题,因为结果变得不稳定/过于依赖于单个元素(来源)。(完美)多重
共线
性也是神经网络
的
一个问题吗?
浏览 0
提问于2018-02-26
得票数 21
1
回答
检测高度相关属性
、
、
、
当使用多元线性回归时,科学知识能被用来去除高度相关
的
特征吗? 关于@behzad.nouri发布给
的
答案,我有一些问题可以避免我
的
困惑。因此,他
测试
了5列之间
的
高度多重
共线
性或自
变量
的
特征;每列都有100行或数据。他知道w接近于零。因此,我是否可以说,第一列或第一自
变量
应该
删除
,以避免非常高
的
多重
共线
性?
浏览 3
提问于2015-11-06
得票数 2
回答已采纳
1
回答
特征中
的
共线
性和多重
共线
性?
、
、
、
数据科学家/ML工程师最常用
的
检测特征之间
共线
性(或)多重
共线
性
的
一些先进或基本方法是什么?
浏览 0
提问于2019-03-18
得票数 0
3
回答
多元
共线
性(方差通货膨胀系数)在执行模型之前要
删除
的
变量
、
、
我正在用python做一个机器学习系统模块
的
练习,它使用汽车
的
数据集(气缸,年份,消耗.)并要求建立一个模型,作为预测汽油消耗量
的
变量
。因为它有三个分类
变量
,所以我已经生成了假人。📷from sklearn.linear_model import LinearRegression 📷 在我<em
浏览 0
提问于2019-06-22
得票数 1
回答已采纳
2
回答
改进线性回归模型
的
技巧
、
、
、
我刚刚在包含7个自
变量
和1个目标
变量
的
数据集上运行了一个线性回归模型。下面是
R
平方和MSE值。训练集
的
均方误差: 36530921.0123有人能给我一些建议来提高这个型号
的
效率吗? 编辑:我刚刚实现了同样
的
问题,使用线性回归和归一化
的
特性。我得到了以下
输出
:训练集
的
均方误差: 5.468490570335696e-10训练集
的</e
浏览 0
提问于2018-04-18
得票数 3
回答已采纳
1
回答
R
中相关数据
的
分析:线性、岭回归、PCR
、
、
、
我已经得到了5个
变量
y, x_1, x_2, x_3, x_4
的
时间序列观察值,任务是找出哪个xes负责y
的
变化。现在
的
问题是,它们都是强交叉相关
的
,并表现出
共线
性。x_1, x_2, x_3, x_4内部没有隐藏
的
组件,它们是成对或以任何其他方式通用
的
-它们只是自然地相关。可以预测
的
是,线性回归给出了不合理
的
结果,在
删除
其中一个
变量
后系数变化很大,这对于高度
共线
浏览 2
提问于2012-09-25
得票数 2
回答已采纳
2
回答
VIF值(
R
)
我有一个问题:有人用页面中可用
的
代码HighstatLibV10.
R
运行corvif函数?我无法获得VIF值,因为
输出
会给出以下错误:我有6个物理
变量
,我在寻找
变量
之间
的
共线
性。
浏览 8
提问于2017-11-16
得票数 1
回答已采纳
2
回答
火花/ SparkML中GLMs
的
无模型总结
、
为此,我使用泰坦尼克号数据集来训练GLM来预测该数据集中
的
“票价”。RuntimeError:没有此GeneralizedLinearRegressionModel
的
培训摘要glm_fare = GeneralizedLinearRegression( labelCol="Far
浏览 5
提问于2019-09-24
得票数 0
1
回答
当我们既有连续
变量
又有类别
变量
作为预测
变量
时,如何在多项逻辑回归中检验多重
共线
性?
、
如何在多项逻辑回归中检验多重
共线
性?我有25个自
变量
和1个因
变量
。在25个独立
变量
中,17个
变量
是连续
变量
,8个
变量
是分类
变量
(具有两个值:是/否或足够/不足)。我想检查这些自
变量
之间
的
多重
共线
性。我正在使用
R
,提前谢谢!
浏览 76
提问于2019-02-27
得票数 0
1
回答
OLS回归结果中由coef生成
的
VIF Python
、
、
然而,我似乎找不到任何来自statsmodel
的
文档来说明如何实现?我有一个需要处理
的
n个
变量
的
模型,所有
变量
的
多重
共线
性值都无助于
删除
共线
性最高
的
值。下面是代码和摘要
输出
,这也是我现在所在
的
位置。Variable: Sales
R
-squared: 0.897 Model:
浏览 1
提问于2017-02-16
得票数 3
1
回答
关于一个热编码
的
两个问题:先放下?和成千上万个类别的特性
、
、
关于一个热门
的
特性编码,我有两个问题:(2)处理具有数千个特征
的
范畴
变量
(大约6000)
的
一次热编码是最好
的
方法。这个数字特别高,因为数据集在一个热编码之前只有大约10个特征。
浏览 0
提问于2021-06-11
得票数 2
2
回答
高尔夫球是最小
的
球体!
、
、
受这挑战
的
启发,以及我一直在研究
的
一个问题在3D空间中给定一个非空
的
点集,求出包含它们
的
最小球面的直径。如果分数是3分或更少,那么问题就很小,为了这个挑战,分数应该大于3分。输入:包含4个或更多点
的
列表,使得没有三个点是
共线
性
的
,也没有四个点是共面的。坐标必须浮动,两个或
多个
点可能共享一个坐标,尽管没有两个点是相同
的
。
输出
:集合
的
直径(包含集合中所有点
的
最小球体
的
浏览 0
提问于2020-12-29
得票数 29
1
回答
如何用生命线包来估计cox模型?
似乎这个关于coxphfitter().does
的
问题解决了这个问题。我认为生命线库不能用ML方法计算系数,这里是.So,我复制错误和示例代码,.I应该说我只写了代码,比如输入,而不是全部。
浏览 7
提问于2021-01-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
多元线性回归之SPSS、SAS、Stata实现
40道机器学习经典问题系列二
数据科学实例教程之Logistic
多元线性回归
多重线性回归假设条件(三)
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券