我试图获得使用TreeBagger函数创建的模型的5倍交叉验证错误,但是我一直得到一个错误。
使用crossval>evalFun出错--函数'regrTree‘生成以下错误:输入参数太多。
我的密码在下面。谁能给我指明正确的方向?谢谢
%Random Forest
%%XX is training data matrix, Y is training labels vector
XX=X_Tbl(:,2:end);
Forest_Mdl = TreeBagger(1000,XX,Y,'Method','regression');
err
我目前正在使用R和h2o库的不同机器学习方法处理多个数据集。因为我对每个数据集有几个10倍的交叉验证,所以我为每个数据集运行了一个随机的GridSearch,并使用h2o.saveGrid保存了网格。当我再次加载这些网格以使用h2o.stackedEnsemble构建组件时,它将返回错误消息。
Error: water.exceptions.H2OIllegalArgumentException: Failed to find the xval predictions frame id. Looks like keep_cross_validation_predictions wasn'
我正试图用一种不同的方式来计算性能,它现在是如何为模型内置的。
我想访问交叉验证期间的原始预测,这样我就可以自己计算性能了。
g = h2o.get_grid(grid_id)
for m in g.models:
print "Model %s" % m.model_id
rrc[m.model_id] = m.cross_validation_holdout_predictions()
我可以用数据集上的模型运行预测,但我认为这个测试可能会有偏差,因为模型以前见过这些数据,还是没有呢?我是否可以对同一数据集进行新的预测,并使用它来计算性能?
我正在此上进行支持向量回归,我认为我正在启动SVR,可能在调用变量或使用内核的方式上出错。MWE的代码相当长,因此我对其进行了大量注释,并突出显示了相关部分
# Import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import scikit_posthocs as sp
import seaborn as sns
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection im
问题的实质:我想用互联网上现成的例子来理解最简单的神经网络。我训练了它,然后我不明白如何在条件用户的输入数据上测试它的有效性。我在互联网上找到了模型的函数: predict()、save()、loaded_model()。如果结果是loaded_model()和16_model(),并且创建了文件夹'16_model‘,则会从created ()抛出错误。请告诉我如何使用它,或如何测试神经网络的输入,而不是测试数据。
import keras
from keras.models import Sequential
from keras.layers import Dense
impor
我正在尝试建立一个基于回归的预测(比如预订网站):预测每家酒店的点击率。
我必须生成一个包含两列的.csv文件:
hotel_id
predicted_number_of_clicks for all hotel_ids.
我的第一个问题是:我是否应该将hotel_id作为预测模型的特性?我想我必须放弃它..。对吗?
第二个问题是:如果从模型特性中删除hotel_id,我如何才能只在这2列中写入csv文件?