腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3646)
视频
沙龙
1
回答
使用
分层
套索
的
变量
重要性
(
hierNet
)
、
、
x,TRUE,TRUE)> newx=matrix(rnorm(100*10),ncol=10)GG converged in 31 iterations.> i,lamconverged in 602 iterations.GG converged
浏览 29
提问于2020-06-09
得票数 0
回答已采纳
1
回答
glmnet包是否支持多
变量
分组
套索
回归?
、
、
、
我正在尝试
使用
glmnet库对具有300个自
变量
和11个响应
变量
的
数据集执行多
变量
套索
回归。我想对一些输入
变量
进行分组,然后应用多
变量
分组
套索
回归,以便
套索
模型根据它们
的
重要性
选择或丢弃所有分组
变量
。
浏览 2
提问于2020-07-03
得票数 1
1
回答
回归用高基数分类特征
的
特征
重要性
(数值退化
变量
)
、
、
、
、
我试图利用随机森林
的
特征输入来对一个回归问题进行一些经验
的
特征选择,其中所有的特征都是分类
的
,而且很多特征都有很多级别(大约在100到1000之间)。假设一个热编码为每个级别创建了一个虚拟
变量
,那么每个级别的特性导入都是针对每个级别的,而不是每个特性(列)。什么是聚合这些特性
重要性
的
好方法?我考虑过总结或获得所有级别特性
的
平均
重要性
(可能前者会倾向于那些具有更多级别的特性)。在这个问题上有什么参考资料吗? 我们还能做些什么来减少功能
的
浏览 0
提问于2017-04-05
得票数 12
回答已采纳
1
回答
Caret包- glmnet
变量
重要性
、
、
、
我正在
使用
glmnet包来执行
套索
回归。我现在正在
使用
插入符号包研究特性
的
重要性
。我不明白
的
是
重要性
的
价值。有没有人能开导我?是否有计算这些值
的
公式,或者这是否意味着这些值是基于beta值
的
?
浏览 0
提问于2016-05-31
得票数 2
3
回答
如何找出RandomForestClassiferer在科学学习中经常
使用
的
特性?
、
我有几个随机
的
森林模型,效果很好。现在,我想做基于这个模型
的
特性选择。我如何找出一个模型经常
使用
的
特性,例如RandomForestClassifier在scikit学习中
的
应用?
浏览 0
提问于2018-03-01
得票数 2
1
回答
LASSO框架
的
分类
、
、
、
我试图确定我
的
特征在我
的
分类
使用
拉索
的
重要性
。不过,我找不到任何参考或指引。据我所知,
套索
主要是用于回归,但是,有什么方法或指导方针,我可以工作吗?如果没有办法,我还有其他类似的方法来确定我
的
特征
的
意义吗?哪种特征对分类影响最大?
浏览 4
提问于2016-01-11
得票数 3
回答已采纳
3
回答
glmnet -可变
重要性
?
、
我正在
使用
glmnet包来执行
套索
回归。有没有办法获得所选择
的
各个
变量
的
重要性
?我想过对通过coef获得
的
系数进行排序(...)命令(即离零
的
距离越大,
变量
越重要)。这是一种有效
的
方法吗?谢谢你
的
帮忙!
浏览 0
提问于2016-02-18
得票数 8
2
回答
群
套索
与特征选择
、
、
我有一个包含大量分类
变量
和二进制目标
变量
的
数据集,我想把它放到svm中。我将分类
变量
转换为虚拟
变量
,因为我
的
观察结果比我想要执行
的
特性选择
的
变量
少得多。因为我把分类
变量
转换成虚拟
变量
,所以我知道我不能
使用
简单
的
lasso,因为它会删除部分虚拟
变量
。 我正在寻找一个包来实现具有二进制目标的python上
的
群lasso,但是我找不到
浏览 0
提问于2022-08-17
得票数 1
1
回答
pandas apply min函数中数据帧中
的
选择列
、
、
、
., df_n]X_train=[df_1_1,df_2_1,...,df_n_1]df_1_1是列表
的
第一个数据帧(第一个
变量
),也是这个数据帧
的
第一列,他
的
数据帧有m列。 如果此
变量
应用不同类型
的
平滑或过滤器,则此数据帧
的
每一列。我在每个数据帧中有100列,我想选择(不同数据帧
的
浏览 11
提问于2018-08-17
得票数 0
1
回答
根据glmnet包最好地区分组
的
变量
、
、
下面是代码可复制
的
示例:coefsMin <- coef(tempcv, s="lambda.min")$setosaPetal.Length 4.536932 Petal.Width 9.2
浏览 0
提问于2021-06-29
得票数 1
回答已采纳
1
回答
XGBoost对于
变量
选择是否有效?
、
、
、
我知道XGBoost
的
用法,我知道这是一个业余问题 XGBoost是否可以像
套索
一样用于
变量
消除和选择目的,或者我们需要先
使用
套索
来消除
变量
,然后再
使用
XGBoost来获得预测结果?
浏览 43
提问于2019-07-03
得票数 0
1
回答
我需要帮助来应用引导程序
、
我已经应用了
套索
和岭回归,找到了最优
的
λ,并重新构建了模型。但我不明白在那之后我该做什么。“。对于糖尿病数据集(上传到Moodle),我们希望
使用
10个特征(X
变量
)来预测prog (Y),这是基线后一年疾病进展
的
定量评估。
变量
prog是数据中
的
最后一列。在拟合岭回归和
套索
之前,不要忘记标准化所有的X
变量
,使它们在相同
的
尺度上。
使用
岭回归和
套索
预测程序。在两个回归中,<e
浏览 2
提问于2021-11-26
得票数 0
1
回答
我可以
使用
Python中
的
套索
方法拟合VAR模型吗?
、
、
我必须在VectorAutoregressive模型中拟合40个时间序列,大量
的
变量
建议
使用
选择方法。我很喜欢
使用
套索
方法,但我
使用
的
是statsmodel进行拟合,而
使用
该库实现
套索
的
唯一方法是线性回归模型。有人能帮上忙吗?
浏览 20
提问于2020-05-14
得票数 0
回答已采纳
1
回答
0- Lasso回归R^2
的
归一化结果
、
、
我正在对7000行数据集进行回归分析,数据集
的
训练/测试分割率为70%/30%。我
使用
一个
变量
X来预测
变量
Y。Train score: 0.082然而,在正常化(X = (X-X.min())/(X.max()-X.min()))之后,我会收到:
浏览 0
提问于2019-11-05
得票数 1
1
回答
Winbug中
的
不平衡面板和多维数组
、
我有一个数据不平衡
的
投入需求模型。因
变量
是yijt,其中i表示生产函数(i=1,2,3)
的
输入,j表示坚定
的
(j=1,..,21),t表示时间(ti=1,..,Ti)。因此,由于面板是不平衡
的
,有三个等式,那么在winbug中
使用
它
的
正确格式是什么呢? 我试着
使用
STATA long格式( 3*107 )
的
形式,其中
的
索引有点不同。所以,没有明确
的
时间索引。我对列
使用
嵌
套索
浏览 2
提问于2013-03-25
得票数 3
3
回答
相关
变量
的
套索
或脊线
、
、
我试图理解一句话:“在存在相关
变量
的
情况下,岭回归可能是首选。”假设我们有
变量
a1,a2,b1,c2,并且2个a‘s是相关
的
。如果我们
使用
套索
,它可以消除a’s中
的
一个。
套索
和岭都会收缩。这是一个错误
的
引用,还是我漏掉了什么?(也许想得太简单了)
浏览 1
提问于2017-03-20
得票数 2
1
回答
Rapidminer
变量
重要性
、
、
我想知道我们
的
模型
的
变量
重要性
,它建立在3个模型(随机森林,深度学习和梯度增强树)上。我知道你应该
使用
“树
的
重要性
权重”来评估随机森林
的
变量
重要性
。但是,您如何评估这三个模型组合
的
变量
重要性
?
浏览 30
提问于2019-12-06
得票数 1
2
回答
套索
和稀疏解
、
在一篇文章中,我发现了以下几点:
套索
回归方法提供了一种稀疏
的
解决方案,因此可以提高模型
的
可解释性。 有人能帮我理解一下这是什么意思吗?据我所知,方程组解
的
稀疏分解是具有最小伪l范数
的
维数l
的
向量,使得该系统仍然是满足
的
。将一些回归系数设置为零
的
稀疏解决方案如何在解释中有所帮助?
浏览 28
提问于2020-06-22
得票数 0
回答已采纳
1
回答
用于多个输入数据集和分类结果
变量
的
LASSO方法
、
我目前有10个估算数据集,一个分类结果
变量
(序数,三个级别),一个分类暴露
变量
,以及协
变量
的
混合(数字,分类,二进制)。我想应用
套索
方法来选择哪些
变量
应该包括在最终
的
多项式logistic回归模型中,但我还没有找到任何关于这个主题
的
论文,或者提供了如何执行这一操作
的
R代码。我发现有许多论文表明,如果你有一个二元或连续
的
结果,而不是一个绝对
的
结果,那么可以进行哪种程序。有谁有资源吗?非常感谢您抽出时间
浏览 8
提问于2021-07-22
得票数 0
1
回答
决策树和特征
重要性
:为什么决策树没有显示所有
变量
的
重要性
?
、
、
我运行了一个包含62个独立
变量
的
决策树来预测股票价格。然而,当
使用
classifier_DT_tuned$variable.importance提取特征
重要性
时,我只看到了55个
变量
的
重要性
,而不是62个
变量
的
重要性
。我本以为决策树会选取最重要
的
变量
,但随后会为未
使用
的
变量
分配0.00
的
重要性
浏览 79
提问于2019-10-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PS磁性套索工具的使用方法讲解
边缘计算中分层安全的重要性
CAD教程 | 如何使用中望CAD灵活的选择方式——套索选择
第二堂课,变量的使用
怎么利用宏变量来控制分层铣铣削的深度?只需要简单一步
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券