腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
h2o
中
的可自定义
交叉
验证
(依赖于培训集的特性)
、
、
我有一个模型,其中一些输入特征是
从
训练数据集(例如,值的平均值或中值)计算出来的。我试图在这个模型上执行n折叠
交叉
验证
,但这意味着这些特性的值将根据为每个折叠选择的训练/
验证
样本而有所不同。在
h2o
(我在R中使用它)
中
是否有一种方法可以传递一个函数,一旦确定了训练集,就可以计算这些特性? 这似乎是一个相当直观的功能,但我一直未能找到任何类似的文件,这是现成的。它存在吗?
浏览 0
提问于2018-02-22
得票数 2
回答已采纳
1
回答
H2O
-
从
python
代码
中
获取
交叉
验证
结果
、
我正在尝试使用
python
访问一些
H2O
模型的
结果
。import
h2o
def get_model_det
浏览 15
提问于2020-05-14
得票数 1
回答已采纳
1
回答
H2O
Python
:提取具有最高
验证
数据集的网格搜索模型
、
我正在使用
H2O
Python
使用网格搜索构建一个随机森林模型。我在训练和
验证
中
对数据进行分割,并使用k折叠
交叉
验证
来选择网格搜索
中
的最佳模型。我能够用训练集上最好的MSE检索模型,但我想检索
验证
集上具有最高AUC的模型。 我可以用
Python
编写所有
代码
,但我想知道是否有一种
H2O
方法来解决这个问题。对我怎么做有什么建议吗?
浏览 2
提问于2016-10-23
得票数 2
回答已采纳
1
回答
h2o.ensemble和h2o.stack在封装h2oEnsemble中有什么不同?
、
根据对功能的描述: h2o.stack:这个函数使用用户指定的现有
H2O
基本模型列表创建一个“超级学习者”(叠加)集成。h2o.ensemble:这个函数使用用户指定的
H2O
基础学习算法创建一个“超级学习者”(叠加)集成。
浏览 4
提问于2017-02-23
得票数 6
回答已采纳
2
回答
XGB :组合
H2o
保持预测
、
、
使用时:"keep_cross_validation_fold_assignment": True有没有关于如何在
Python
中
做到这一点的线索?
浏览 6
提问于2018-07-21
得票数 4
回答已采纳
1
回答
从
h2o
中
,是否有一种方法可以将N个文件夹
交叉
验证
结果
导出到数据文件
中
?
、
、
我正在用
H2O
火花水建立GBM模型。我知道我们可以使用下面的
代码
查看N个文件夹的
交叉
验证
结果
:但是,是否有一种方法可以将每个文件夹的模型性能保存到数据帧
中
例如,将每个文件夹的AUC保存到数据框架
中
。
浏览 6
提问于2018-11-01
得票数 0
回答已采纳
1
回答
H2o
交叉
验证
不对应于单列/测试
、
、
、
我试图了解在
H2o
中
交叉
验证
是如何工作的,当指定了传递'fold_column‘参数的折叠时。图书馆说: fold_column选项指定数据集中的列,该列包含每个观察的
交叉
验证
折叠索引分配。我假设在每次
交叉
验证
迭代
中
,使用带有fold_column =i的行作为测试集,其余的行用作列车集。但是,如果我用这些分裂来分别训练和测试模型,就会得到不同的性能
结果
。在下面的示例
中
,我创建了一个值介
浏览 2
提问于2020-07-28
得票数 1
1
回答
keep_cross_validation_predictions参数在
H2O
AutoML
中
的应用
我在R中使用
H2O
AutoML进行建模,我发现AutoML支持
h2o
web接口页面(即Flow)上的keep_cross_validation_predictions选项,当我们使用R接口运行时,它不支持它
浏览 1
提问于2018-02-01
得票数 2
回答已采纳
1
回答
R的h2o.stack是否有等效的
python
?
、
、
、
根据的文档,
H2O
的
python
实现允许您轻松地构建集成模型。然而,这仅限于使用相同的底层培训数据构建基本分类器。我有基于时间的特性,其最小日期根据数据源的不同而变化。每个数据样本都是一个时间点。据关于R的堆叠集成实现,有一个选项,只执行金属学习步骤,应该只需要k倍
交叉
验证
的预测,对每个基本模型和真正的目标值。
浏览 4
提问于2017-07-12
得票数 2
回答已采纳
3
回答
R
H2O
轮询错误消息
、
、
我试图通过R在
H2O
中
运行gbm模型,并得到以下错误之一:Error in tail(res$cms, 1)[[1]] : subscript out of bounds 下面是导致错误的
代码
行最后,我用
Python
语言编写了一个脚本,用week_number将这个大文件分解成单独的csv文件。在读取文件的过程
中
,大约有2/3的时间我得到了一个空字节异常错误。
浏览 0
提问于2015-02-28
得票数 3
1
回答
h2o
和插入符号
中
的数据分区功能似乎在泄漏数据?
、
、
、
、
我之所以怀疑这一点,是因为我在使用
H2O
的h2o.splitFrame函数或插入符号的createDataPartition函数时得到了两个完全不同的
结果
--当我自己手动划分数据时: 在我的数据与时间序列数据,3000-4000个数据点,使用10倍的简历,我获得了非常可接受的
结果
在所有的数据集:培训,
验证
,
交叉
验证
,和测试集时,使用插入符号的xgboost或
h2o
。然而,只有使用插入符号的createDataPartition函数和
H2O
的h2o.sp
浏览 1
提问于2017-04-18
得票数 1
回答已采纳
1
回答
在
h2o
中保留一次
交叉
验证
、
、
、
我想检查我在
h2o
中非常小的df的休假一次
交叉
验证
的
结果
。这是我输入的df: min_rows = 2,我在上面的
代码
中</em
浏览 0
提问于2019-02-25
得票数 1
回答已采纳
1
回答
在应用
交叉
验证
之前对特征进行预处理而不会泄漏
、
、
我想做一些带有
交叉
验证
的预处理(缩放,特征工程,例如目标编码)。我知道最好的和理论上正确的方法是为
交叉
验证
的每个训练/测试步骤分别预处理数据。但是,我使用的是
H2O
,除非我弄错了,否则它不允许我创建预处理管道。在我看来,这避免了
从
训练样本到测试样本的泄漏,但情况似乎
浏览 12
提问于2018-08-23
得票数 0
回答已采纳
1
回答
H2O
数据分割成列时行索引的
获取
及测试
、
、
、
我是
H2O
的新手。到目前为止,对于火车测试的分割,我已经使用了sklearn的StratifiedKFold()。在
H2O
中
,我无法理解如何在进行
交叉
验证
时
获取
索引。
从
我通过视频和博客收集到的信息来看,这就是我们在
H2O
上做简历的方式: gbm_model = H2OGradientBoostingEstimator(model_id = 'gbm_model',nfolds
浏览 1
提问于2017-11-16
得票数 1
回答已采纳
1
回答
h2o
交叉
验证
预测
中
AUC值的解释总结
、
、
、
、
我注意到,在一些运行
中
: train=as.h2o(u) training_framecompute_p_values = TRUE, nfolds = 10, keep_cross_validation_predictions= TRUE) 对于模型的一些cv迭代,在AUC的
交叉
验证
度量摘要
中
存在例如: print(mod@model$cros
浏览 89
提问于2019-02-15
得票数 0
回答已采纳
1
回答
尽管
交叉
验证
结果
非常成功,但对随机森林的过度拟合
、
、
因此,当我使用10倍cv的RF时,我在每个cv (AUC为99%)中观察到了太好的
结果
,这是正确的,而在我的测试集中,我得到了更糟糕的
结果
,比如0.7。这是我的
代码
:from h2o.estimators import H2ORandomForestEstimator h2o.init(port=23, nthreads=4)我在网格搜索
中
尝试过许多不同的参数,但是没有一个改进
结果
。
浏览 2
提问于2017-11-13
得票数 1
回答已采纳
1
回答
交叉
验证
指标
中
的默认阈值-
h2o
R包
、
、
、
我使用R
中
的
h2o
包创建了GBM的笛卡尔网格,并将每个模型的
交叉
验证
指标保存在数据帧
中
。因此,对于每个模型,我将
结果
存储在model@model$cross_validation_metrics_summary
中
。在model@model$cross_validation_metrics_summary
中
,用于计算F1和F2分数、精确度、召回率和特异性的阈值是什么?是否有默认值?
浏览 9
提问于2019-09-18
得票数 0
回答已采纳
2
回答
K均值聚类在R
中
的并行版本
、
visualizationfviz_nbclust(df, kmeans, method = "wss") 然而,考虑到我的数据集的大小,似乎这个方法在超过一个小时后不会产生
结果
浏览 19
提问于2019-08-12
得票数 0
2
回答
用
Python
初始化
H2O
、
当试图通过运行以下行来初始化
H2O
时:import
h2o
Traceback (most recent call last): h2o.init() File "C:\Anaconda\lib\site-packages\
h2o
,ice_root=ice_root,strict_version_
浏览 5
提问于2015-11-30
得票数 1
回答已采纳
1
回答
用于
交叉
验证
的
h2o
形状值/ predict_contributions
、
我研究了
从
xgb和gbm模型
中
公开Shap值的h2o.predict_contributions函数。此函数是否也提供来自
交叉
验证
预测的这些指标?我好像找不到他们。library(
h2o
)data(Sonar) mdl = h2o.xgboost(x=names(Sonar
浏览 20
提问于2019-05-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python教程|如何批量从大量异构网站网页中获取其主要文本?
数据分享|Python用偏最小二乘回归Partial Least Squares,PLS分析桃子近红外光谱数据可视化
【资料】Practical Machine Learning with H2O
真实干货:训练自己的验证码识别模型
Python中有哪些常用的工具可以用于接口自动化
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券