如何评估分类器的精度，并在GridSearchCV中留下一条roc曲线？

评估分类器的精度可以通过使用一系列指标来衡量，其中最常用的是准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1值（F1-score）。下面是对这些指标的详细解释：

准确率（Accuracy）：分类器正确预测的样本数量与总样本数量之比。准确率适用于样本分布均衡的情况，但对于样本分布不均衡的情况下，准确率可能会误导评估结果。
精确率（Precision）：分类器预测为正例的样本中，真实正例的比例。精确率衡量了分类器预测为正例的准确性，适用于关注结果为正例的情况。
召回率（Recall）：真实正例中，分类器正确预测为正例的比例。召回率衡量了分类器对真实正例的覆盖程度，适用于关注漏报率的情况。
F1值（F1-score）：精确率和召回率的调和平均值，综合考虑了分类器的准确性和覆盖程度。F1值是一个综合指标，当精确率和召回率同时较高时，F1值也较高。

在GridSearchCV中绘制ROC曲线需要进行以下步骤：

导入所需的库和模块：导入GridSearchCV类、分类器模型、roc_curve函数和matplotlib库。
准备数据集：将数据集分为训练集和测试集。
创建分类器模型：实例化一个分类器模型，例如支持向量机（SVM）或随机森林（Random Forest）。
创建参数网格：为分类器模型定义一组参数网格，例如不同的学习率、正则化参数或决策树深度。
创建GridSearchCV对象：将分类器模型和参数网格传递给GridSearchCV类的实例化对象。
训练模型：使用GridSearchCV对象的fit方法对数据进行训练，该方法将自动进行交叉验证。
绘制ROC曲线：使用GridSearchCV对象的best_estimator_属性获取最佳模型，并使用测试集数据对其进行预测。然后，使用roc_curve函数计算真正例率（True Positive Rate）和假正例率（False Positive Rate），并使用matplotlib库绘制ROC曲线。

以下是一个示例代码，展示了如何评估分类器的精度和在GridSearchCV中绘制ROC曲线：

from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

# 准备数据集
X_train, X_test, y_train, y_test = ...

# 创建分类器模型
classifier = SVC()

# 创建参数网格
param_grid = {
    'C': [0.1, 1, 10],
    'kernel': ['linear', 'rbf']
}

# 创建GridSearchCV对象
grid_search = GridSearchCV(classifier, param_grid, scoring='accuracy')

# 训练模型
grid_search.fit(X_train, y_train)

# 获取最佳模型
best_model = grid_search.best_estimator_

# 预测测试集数据
y_pred = best_model.predict(X_test)

# 计算ROC曲线的真正例率和假正例率
fpr, tpr, thresholds = roc_curve(y_test, y_pred)

# 计算AUC值
roc_auc = auc(fpr, tpr)

# 绘制ROC曲线
plt.figure()
plt.plot(fpr, tpr, color='darkorange', label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='navy', linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc="lower right")
plt.show()

以上代码中，需要将X_train、X_test、y_train和y_test替换为相应的训练集和测试集数据。此外，还可以根据实际需求调整分类器模型、参数网格和评估指标。

页面内容是否对你有帮助？

有帮助

没帮助

什么是AUC - ROC曲线？

、

AUC - ROC曲线是对不同阈值设置下的分类问题的性能度量.ROC是一条概率曲线，AUC代表可分性的程度或尺度。 Roc和AUC一样吗？

浏览 0提问于2019-12-21得票数 2

3回答

我是机器学习的新手。这是我的1^{st}机器学习项目，我正在对不平衡的数据集进行分类。目标变量中也有多个类。我想知道在GridSearchCV中评分最合适的指标是什么。我认为 roc_au有时用于不平衡的数据集。但是有几个 ‘roc_auc’ ‘roc_auc_ovo’ ‘roc_auc_ovr’ 我该用哪一种？或者，查准率-召回_auc也被使用.但我似乎找不到GridSearchCV的评分标准。我如何在GridSearchCV中使用它？谢谢 X_train, X_test, y_train, y_test = train_test_split(X_total, Y_total,

浏览 0提问于2021-10-26得票数 1

3回答

精确召回曲线或ROC曲线可能是一条水平线吗？

、、、、

我正在对不平衡的数据进行二进制分类。因为在这种情况下，精确性不是很有意义。为了评价模型的性能，我使用Scikit-学计算精确召回曲线和ROC曲线。但我发现，当我使用随机森林和大量的估计量时，这两条曲线都是一条水平线，当我使用SGD分类器来拟合它时，也会出现这种情况。中华民国的图表如下：以及精确召回图：由于随机森林的行为是随机的，我不是每次跑步都有一条水平线，有时我也会得到一个规则的ROC和PR曲线。但是水平线更常见。这是正常的吗？还是我在代码中犯了一些错误？下面是我的代码片段： classifier.fit(X_train, Y_train) try:

浏览 1提问于2015-07-14得票数 1

回答已采纳

1回答

在维奥拉·琼斯的面部检测纸上是如何绘制ROC曲线的？

、、、、

我在看维奥拉和琼斯的报纸。在那里，他们用ROC曲线来测量分类器的精度。请有人解释一下，在像人脸或非人脸这样的二元分类器中，如何绘制ROC曲线？我是说数据点是如何得到的。 (X，Y)= (假阳性，正确率) 我是否必须为我的训练数据集的每一个正面和负面点计算这些分数。但我的正负数据集大小不一。我有点困惑。

浏览 4提问于2018-02-21得票数 0

1回答

如何用滑雪板对两条ROC曲线进行配对比较？

、、、

我必须评估两种分类算法的性能。我从roc_curve ()中获得假阳性率和真阳性率。我使用了以下代码： fpr = dict() tpr = dict() roc_auc = dict() for i in range(2): fpr[i], tpr[i], _ = roc_curve(true_labels, pred_labels) roc_auc[i] = auc(fpr[i], tpr[i]) 我有两个分类器的这个信息，现在我想比较它们。我知道可以使用AUC或其他度量标准，但我真的想了解ROC曲线相对于另一条曲线的次数百分比，基于这个原因，我想比较一下这两条曲线的两两点

浏览 4提问于2020-06-24得票数 0

回答已采纳

1回答

如何绘制多类分类器的准确率和召回率？

、、、、

我正在使用scikit learn，我想要绘制精确度和召回率曲线。我使用的分类器是RandomForestClassifier。scikit学习文档中的所有资源都使用二进制分类。另外，我可以绘制多类的ROC曲线吗？此外，我只找到了多标签的支持向量机，它有一个RandomForest没有的decision_function

浏览 5提问于2019-05-11得票数 20

回答已采纳

1回答

用KNN模型使用ROC曲线是否明智？如果是的话，为什么？

、、、

我是一个初学者做我的第一个ML项目。我正在对不平衡数据集进行二进制监督分类，并希望使用ROC曲线作为我的模型的性能度量。我使用Logistic回归、支持向量机和K近邻作为分类器。对于Logistic回归，我了解什么是ROC曲线，以及如何调整阈值。然而，当我预测K近邻的概率时，我不明白ROC曲线在哪里派上用场，因为阈值无论如何都不能变。那么，为什么还要为K最近的内格勃( Neigbors )实施ROC曲线呢？

浏览 0提问于2022-12-15得票数 2

回答已采纳

2回答

表示机器学习分类器性能的图表

、、、、

除了ROC之外，还能画出多少种图形来表示机器学习分类器的性能？

浏览 0提问于2020-07-11得票数 1

1回答

如何在python中优化查全率曲线而不是AUC-ROC曲线？

、、、、

我正在问一个后续的问题，这是我以前在后提出的.我只在Python learn中使用默认设置。似乎优化是在AUC-ROC，但我更感兴趣的是优化精确召回。以下是我的密码。 # Get ROC y_score = classifierUsed2.decision_function(X_test) false_positive_rate, true_positive_rate, thresholds = roc_curve(y_test, y_score) roc_auc = auc(false_positive_rate, true_positive_rate) print 'AUC-&#

浏览 2提问于2016-02-28得票数 6

2回答

如何在Spark ml库中从交叉验证中获得准确率、精确度、召回率和ROC？

、、、

我使用的是Spark 2.0.2。我还使用了机器学习的"ml“库和数据集。我想做的是运行交叉验证的算法，并提取提到的指标(准确性、精确度、召回率、ROC、混淆矩阵)。我的数据标签是二进制的。通过使用MulticlassClassificationEvaluator，我只能通过访问"avgMetrics“来获得算法的准确性。此外，通过使用BinaryClassificationEvaluator，我可以获得ROC下的区域。但我不能同时使用它们。那么，有没有一种方法可以提取所有想要的指标呢？

浏览 0提问于2017-01-18得票数 10

2回答

如何从多个分类模型创建ROC曲线

、、、、

如何从几种分类模型中创建ROC曲线，以便相互比较。我正在使用KNIME分析平台。

浏览 3提问于2016-08-11得票数 0

4回答

ROC曲线解释

、、、

我训练了一个CNN模型和一个组合的CNN-SVM分类模型。我想用ROC曲线来比较它们的性能，但我搞不懂哪种型号更好。如何解释给定的ROC曲线？ 📷 📷

浏览 0提问于2019-11-24得票数 3

回答已采纳

1回答

在平衡数据上训练的二进制分类器测试数据不平衡的低精度召回曲线

、、

我有一个非常不平衡的数据集(9:1)，为此我执行了欠抽样，并实现了一个均衡的训练集(~130 k样本总后平衡)。我正在使用RandomForest进行分类。我的测试集由不平衡的数据组成(因为在现实世界中是这样的)，使用AUC=0.873，我的ROC曲线非常好。然而，我的P曲线受到了AUC=0.547的影响. 📷 如果我平衡测试数据，我会看到一个更好的AUC；然而，这并不是地面事实在过去的表现，因此引用平衡测试数据的性能似乎不太合理。 📷 我做错了什么？我应该对不平衡的数据进行培训吗？或者有什么方法可以改善P曲线？

浏览 0提问于2018-07-31得票数 2

2回答

“随机森林经典”不同超参数的ROC曲线？

、、、

我目前正试图在一个由5000个实例组成的数据集上训练一个RandomForestClassifier，其中包含12个(现在)编码的特性和一个二进制目标标签。通过GridSearchCV我发现 best_parameters = { 'criterion': 'gini', 'max_depth': 12, 'max_features': 'log2', 'n_estimators': 300 } 最有效的 hyperparameters = {

浏览 0提问于2017-10-09得票数 4

回答已采纳

1回答

如何获得为遗传算法分类器绘制ROC曲线的分数？

、、、、

我试图得到一个二进制(好/坏)分类器的ROC曲线，我在一个项目中使用。该分类器使用遗传算法进行预测。例如，由1.0,0.5,0.4,0.7给出的测试染色体如果与另一条染色体匹配，比如0.8,0.5,0.3,0.6，则被认为是好的。通过匹配，我的意思是值(来自另一个染色体)低于某一特定值。我已经完成了600个实例的分类，我有了最终的混淆矩阵(这个矩阵指的是我们可以计算最终TPR和FPR的四值表)，每个实例的正确分类标签，以及每个实例的所有预测。我读过关于ROC曲线、和的文档。怎样才能得到中华民国的曲线呢？用我最后的四值表，我想我只能画出曲线上的一个点。上面附加的链接不断地提到，我需要一个

浏览 2提问于2016-04-20得票数 1

回答已采纳

1回答

构造ROC曲线所涉及的变量是什么？

、、

假设我有一个分类器，我实现了远10%和15%的FRR。我需要用这些做些什么来构造一条ROC曲线？我很难看清它们到底代表了什么，以及它们的使用情况。我似乎没有一个重要的变量，即FAR和FRR向一个或另一个方向移动。我还能用ROC吗？

浏览 2提问于2016-05-02得票数 1

回答已采纳

1回答

scikit learn roc_auc_score()返回精确值

、、

我正在尝试使用以下方法使用sklearn.metrics.roc_auc_score计算ROC曲线下的面积： roc_auc = sklearn.metrics.roc_auc_score(actual, predicted) 其中actual是具有基本事实分类标签的二进制向量，predicted是具有我的分类器预测的分类标签的二进制向量。然而，我得到的roc_auc的值与精确值(标签被正确预测的样本的比例)非常相似。这不是一次性的事情。我对参数的不同值尝试分类器，每次都得到相同的结果。我在这里做错了什么？

浏览 1提问于2014-03-11得票数 8

回答已采纳

1回答

您应该在哪个阶段绘制验证和学习曲线？

因此，假设我有一个二进制分类问题，我从一个logistic回归模型开始。我快速地评估了模型的准确性(假设我们没有倾斜的数据集)。在此之后，我开始实现其他模型的比较，我开始检查准确性评分，并绘制一条ROC曲线来评估AOC评分。我们可以说，我继续我的logistic回归模型。我不打算微调它和使用网格搜索算法，然后继续选择最佳的超级参数w.r.t的准确性评分。我什么时候才能真正画出学习和验证曲线？我假设我应该把它画在旁边，看看一个更大的参数是如何影响分数的，然后看看我的模型是不合适的还是过拟合的。但是，我不应该更早地绘制学习曲线吗?例如，在我选择从后勤部门开始的第一步。模特？总结一下:画出一

浏览 0提问于2020-09-14得票数 0

1回答

GridSearchCV行为怪异

、、、、

我使用GridSearchCV来寻找支持向量机的最佳参数组合。然而，GridSeasrchCV选择的参数似乎并不是最好的参数。我随机地尝试了一些参数，它们工作得更好。我在测试集中尝试了这两种组合。这是一幅画： 📷 第二个混淆矩阵+分类报告是随机但改进的。为什么GridSearchCV不选择这个组合？

浏览 0提问于2020-09-28得票数 0

1回答

在python中为xgboost超参数运行gridsearchcv时出错

、

我有一组数据，如下所示，提取了前5行以供参考 gvkey year ebit_diff cogs_diff revt_diff xad_diff xint_diff xrd_diff xrent_diff xsga_diff 0 1004 2011 0.007816 0.081074 0.051726 -0.02617 0.011864 -0.052201 -0.016440 -0.048060 1 1004 2012 -0.028573 0.032022 0.002105

浏览 51提问于2021-02-28得票数 0

回答已采纳

1回答

如何使用CNN (Keras)计算多类的一对一ROC

、、、、

我想考10个班的ROC。我使用了CNN模型(keras)。我可以得到一条vs rest曲线，但我想要一对一。以下是我的代码片段。 model.compile(optimizer=keras.optimizers.Adam(0.001), loss='categorical_crossentropy', metrics=['acc']) from keras.callbacks import History history = History() model.fit_generator(generator=tr

浏览 74提问于2020-12-03得票数 0

1回答

ROC曲线下面积(AUC)与混淆矩阵下的分类器评价？

、、

何时应该使用ROC曲线(AUC)下的面积或混淆矩阵进行分类器的评估？例如，对客户的预测是对未来销售的预测。

浏览 0提问于2018-06-22得票数 4

回答已采纳

1回答

深度学习的ROC曲线

、、、、

我正在为图像分类做一个深入的学习项目。我使用Vgg16创建模型，dataset有100个类。测试精度98.9%，损耗0.1731。我得到了以下的ROC和平均精度曲线： 📷 📷 我现在不知道，如果ROC和平均精度的结果是好的，或在曲线中有一个问题，因为曲线是完美的。你知道我为什么得到ROC =1吗？在中华民国和平均精度有什么问题吗？

浏览 0提问于2018-10-31得票数 2

1回答

ROC曲线上SVM位置的默认选择

、、、、

我有一个问题，关于学习支持向量机分类器在什么地方，在默认设置，将在一个ROC曲线上，或者，如果失败，如何找出。我一直认为ROC曲线是对一般性能的描述，所以试图找出分类器的确切位置对我来说是新的。假设ROC曲线看起来像提供给的图上的平均值。假设您在默认设置下对整个数据集进行支持向量机培训，那么它将位于ROC曲线上的何处？编辑：澄清假设我在默认值(sklearn)上训练支持向量机，我将如何确定它在ROC曲线上的位置。或者，SVC类上的哪个设置允许我设置ROC的位置？

浏览 1提问于2015-11-04得票数 1

2回答

机器学习中的评价指标

、、、

下面以一个二分类问题为例，如果我在训练中使用“准确性”作为度量标准，并使用ROCR包找到AUC分数，这将是如何逻辑的？或者我应该始终使用"ROC“作为计算AUC分数的度量标准？数据集不平衡。 control <- trainControl(method="cv", number=5) fit <- train(diabetes~., data=PimaIndiansDiabetes, method="gbm", metric="Accuracy", trControl=control)

浏览 0提问于2016-10-20得票数 1

1回答

混淆矩阵与ROC曲线

、、

我已经使用sci-kit learn构建了一个随机森林模型来预测保险续期。这很棘手，因为在我的数据集中，96.24%的人续费，而只有3.76%的人没有续费。在运行模型之后，我使用混淆矩阵、分类报告和ROC曲线评估了模型的性能。 [[ 2448 8439] [ 3 278953]] precision recall f1-score support 0 1.00 0.22 0.37 10887 1 0.97 1.00 0.99

浏览 0提问于2018-07-18得票数 2

1回答

如何在网格搜索中使用精确召回曲线？

、

我正在尝试使用sklearn网格搜索am进行超视距计的调谐。我希望使用公制的“查全率下的面积”。 gridsearchcv类似于 >>> parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]} >>> svc = svm.SVC() >>> clf = GridSearchCV(svc, parameters, scoring='accuracy') >>> clf.fit(iris.dat

浏览 2提问于2021-07-28得票数 1

回答已采纳

1回答

如何在多标签场景中获取ROC曲线

我有一个多标签的数据集。我正在尝试生成ROC曲线。不幸的是，我无法使用我在进行二进制分类时经常使用的代码。我应该如何修改代码才能在多标签场景中得到ROC曲线？它在错误信息中说，不支持多类格式。我使用的代码是： from sklearn import metrics import matplotlib.pyplot as plt from sklearn.metrics import roc_curve, auc plt.figure() models = [ { 'label': 'Logistic Regression', #'model'

浏览 0提问于2022-11-03得票数 0

回答已采纳

1回答

如何为R中有三个类的randomForest模型绘制ROC曲线？

、、、、

我正在使用R包randomForest创建一个模型，该模型分为三组。 model = randomForest(formula = condition ~ ., data = train, ntree = 2000, mtry = bestm, importance = TRUE, proximity = TRUE) Type of random forest: classification Number of trees: 2000 No.

浏览 8提问于2017-09-09得票数 2

回答已采纳

1回答

调谐模型具有较高的CV精度，但测试精度较低。我应该使用调优模型还是未调优模型？

、、、、

我正在使用Sci Kit学习一个分类问题，并且困惑于如何正确地调优超参数以获得“最佳”模型。 Before任何调整，我的logistic回归分类器对测试集的准确率为74.6%。为了为我的最终模型选择最优的参数，我用一个参数网格来拟合一个GridSearchCV对象-- to --我的训练数据，其中包含了Sci Kit学习的LogisticRegression分类器的默认参数。我所拟合的GridSearchCV模型的CV精度为76.5%，表明该模型将比未调优模型具有更高的精度。 When --我在测试集上拟合并评估了调优模型，我的准确率为73%。这是让我感到困惑的部分。我知道CV的结果应该

浏览 0提问于2023-02-21得票数 0

1回答

sklearn roc_auc_score的门槛是多少？

、、、

在我的分类问题中，我想检查我的模型是否表现良好，所以我做了一个roc_auc_找到准确度的分数，得到值0.9856825361839688 我的问题这是我的代码 x,y=make_classification(n_samples=2000,n_classes=2,weights=[1,1],random_state=24) x_train, x_test, y_train, y_test=train_test_split(x,y,test_size=0.3,random_state=43) from sklearn.neighbors import KNeighborsClassifi

浏览 57提问于2021-02-25得票数 1

3回答

用于模型验证的ROC曲线

、、

是否有一种通用的方法，可以用ROC曲线来验证一个模型？我的理解是，我们可以使用它来比较不同的阈值来确定最佳值，甚至可以看到不同的组在k折叠验证中的行为方式.，但是它需要总是比较不同的阈值。有人告诉我，我应该考虑用ROC曲线来验证我的模型(logistic回归)，但它们并不意味着看分类的阈值，我一直被告知，它应该被用来验证模型之外的一般情况。模型本身甚至不使用交叉验证，因为数据集本身相当大(总计超过一百万个条目)。我是不是漏掉了什么？

浏览 0提问于2022-11-21得票数 1

1回答

滑雪中的roc_curve :为什么它不能正确工作？

、、、、

我正在解决一项多类分类的任务，并希望利用学习中的roc曲线来估计结果。据我所知，如果我设置了一个正标签，它允许在这种情况下绘制曲线。我试着用正标号绘制一条roc曲线，得到了奇怪的结果:类的“正标签”越大，就越接近于roc曲线的左上角。然后，我用数组的二进制标记绘制了一条roc曲线。这两个情节是不同的！我认为第二个是正确的，但是如果是二进制类，则图只有3个点，这并不能说明问题。我想了解，为什么二元类的roc曲线和带有“正标签”的roc曲线看起来不同，以及如何正确地用正标号绘制roc曲线。以下是代码： from sklearn.metrics import roc_curve, auc y_p

浏览 2提问于2019-07-11得票数 0

回答已采纳

1回答

有什么更好的方法来训练你自己的情感分析模型，或者使用像vader和textblob这样经过预先训练的模型呢？

、、、

我有python脚本，它训练了一个用于情感分析的数据集，并使用logisticRegression模型和tfidf、交叉验证、bigram和GridSearchCV创建了一个模型。对文本执行预处理阶段。为了比较这两种模型，我尝试使用预先训练过的模型，如VaderSentiment。根据实际数据得出的结果是： logisticRegression精度: 64.2%VaderSentiment精度: 85.7% 那么，我训练的模型中的错误在哪里呢？还是用vaderSentiment来分析推特的情绪比较好？注意，在我的训练结果中，我得到了： Accuracy: 91.482% Best par

浏览 2提问于2020-07-28得票数 0

1回答

是什么使ROC曲线成为一条曲线，为什么值会发生变化？

、、、

我有个问题。我现在看的是一个分类器，我想用ROC曲线作为度量来检验这个问题。然而，出现了一些我找不到答案的问题。 ROC曲线描述了以下情况 ROC曲线经常被用于以图形的方式显示临床敏感性和特异性之间的联系/权衡，对于每一种可能的检测或联合测试，都是如此。此外，我国曲线下的面积也给出了使用该测试(S)的好处。为什么中华民国的曲线一开始就变成了一条曲线？为什么TP (真阳性)和FP (假阳性)率会发生变化？为何比率会有所不同呢？ 📷

浏览 0提问于2022-10-20得票数 2

回答已采纳

1回答

ML算法评价的度量

、、、、

我有个问题。GridSearchCV的最佳分数是否与平均交叉验证分数相对应，这是评价一个经过不平衡数据训练的算法的正确标准吗？

浏览 5提问于2022-05-25得票数 -1

回答已采纳

1回答

如何解释近乎完美的准确率和AUC-ROC，但F1为零-分数，精度和召回率

、、、

我正在使用python scikit-learn训练ML逻辑分类器来对两个类进行分类。他们处于极不平衡的数据中(大约14300:1)。我得到了几乎100%的准确率和ROC-AUC，但准确率，召回率和f1分数为0。我理解在非常不平衡的数据中，准确性通常是没有用的，但为什么ROC-AUC度量也接近完美？ from sklearn.metrics import roc_curve, auc # Get ROC y_score = classifierUsed2.decision_function(X_test) false_positive_rate, true_positive_rate, t

浏览 0提问于2016-01-10得票数 22

回答已采纳

1回答

带评分函数和修正参数的GridSearchCV

、、、

我的问题似乎与相似，但没有确切的答案。我正在做一个多类、多标签的分类，为此，我定义了自己的得分者。然而，为了得到模型的refit参数并得到模型的最佳参数，我们需要引入一个记分器函数进行修正。如果这样做，我就会得到missing 1 required positional argument: 'y_pred'的错误。y_pred应该是fit的结果。但不知道这个问题从何而来，以及我如何解决这个问题。以下是代码： scoring = {'roc_auc_score':make_scorer(roc_auc_score), 'precis

浏览 5提问于2020-08-22得票数 1

2回答

有什么方法来绘制集合硬投票分类器的ROC曲线吗？

、、

我正在研究一个多类文本分类问题，并为文本分类进行集成学习。我选择硬投票作为合奏技巧。我试图为我的集成方法绘制ROC曲线，但由于显示了ROC曲线不能用于硬投票集成方法这一错误，它是行不通的。因此，我的问题是，是否有任何可能的方法，我可以为我的硬投票集成分类器绘制ROC曲线在python。

浏览 0提问于2020-07-07得票数 3

3回答

微观平均Roc Auc分数是否大于Roc级Auc分数？

、、

我在处理一个不平衡的数据集。序列数据中有11567个阴性样本和3737个阳性样本。验证数据中有2892个阴性样本和935个阳性样本。这是一个二元分类问题，我用Macro平均ROC来评价我的模型。然而，我注意到微平均Roc分数高于特定等级的Roc分数.对我毫无意思。 📷 正如你在图中所看到的，微平均的roc分数对所有的分数都比较高.如果可能的话，你能解释一下背后的原因吗？我使用该滑雪板连接并将其转换为二进制分类(y-true ->一个热门表示)。我还在下面添加了我的代码。 xgboost_model = XGBClassifier(n_estimators= 450,max_depth=

浏览 0提问于2021-02-09得票数 6

回答已采纳

1回答

使用PRROC软件包在ROC曲线中的数据值

、、

我试图绘制一个标识符的ROC曲线，该标识符用于根据背景数据集确定正事件。标识符是两个组之间有一些重叠的概率分数的列表。 FG BG 0.02 0.10 0.03 0.25 0.02 0.12 0.04 0.16 0.05 0.45 0.12 0.31 0.13 0.20 (其中FG =正，BG =负) 我正在用R中的PRROC绘制ROC曲线，以评估标识符如何将数据分类为正确的组。虽然在正数据集和负数据集之间产生的分类器值有明显的区别，但我目前的ROC图在R中显示出较低的AUC值

浏览 4提问于2017-11-24得票数 2

回答已采纳

1回答

基于概率的GridSearchCV超参数整定随机森林分类器

、、

刚刚开始对随机森林二进制分类进行超参数调优，我想知道是否有人知道/是否可以建议如何根据预测的概率而不是预测的分类来设置评分。理想情况下，我希望在下面的概率中考虑roc_auc (即0.2,0.6,0.7,0.1,0.0)而不是分类(即0、1、1、1，0))。 from sklearn.metrics import roc_auc_score from sklearn.ensemble import RandomForestClassifier as rfc from sklearn.grid_search import GridSearchCV rfbase = rfc(n_jobs = 3

浏览 1提问于2018-02-01得票数 3

回答已采纳

1回答

python中的xgboost和gridsearchcv

、、

我对这个有疑问。作者正在进行超参数调整。第一个窗口显示超参数的不同值。然后初始化gridsearchcv，并提到cv=3和scoring='roc_auc' 然后他适合gridsearchcv并使用eval_set和eval_metric='auc' 使用cv和eval_set的目的是什么？我们不应该只用其中的一种吗？如何与scoring='roc_auc' and eval_metric='auc'一起使用是否有更好的方法使用gridsearchcv进行超参数优化？请建议或提供一个链接

浏览 12提问于2022-08-19得票数 0

回答已采纳

1回答

相同Keras模型和数据的精度低于AUC

、、、、

我有一种奇怪的Keras分类行为。我得到了不同的准确性时，使用交叉验证与一个持久化集。 2个相同的模型，但评价方法不同： Model1使用10-K交叉验证(达到0.98平均AUC和最低AUC 0.89). Model2使用支持集(精度为0.82) 我原以为模型2最糟糕的精度是最低的折叠精度(0.89而不是0.82)。小型数据~10kx13 折叠: 10倍模式1： def create_baseline(): # create model model = models.Sequential() model.add(layers.Dense(64, i

浏览 0提问于2018-06-05得票数 0

1回答

理解精确召回曲线和精确/召回度量

、、

我想了解为什么少数类("1")的精确召回曲线如此好，而对于同一个类的精度(0,2)和召回(0,4)的度量却如此糟糕。我将sklearn.metrics.plot_precision_recall_curve与pos_label=0 (多数类)和pos_label=1 (少数类)结合使用。下面您可以看到所使用的代码。 def plotagem_curvas (nome_modelo, modelo, X_test, y_test, folds, pos_label): roc_auc = 0 ap=0 if (pos_label == 0): classe=

浏览 0提问于2021-07-01得票数 1

回答已采纳

1回答

学习管道+ GridsearchCV + XGBoost +学习曲线

、、、、

我是sklearn & XGBoost的新手。我想使用GridSearchCV来调优XGBoost分类器。我想做的检查之一是对火车和测试中的损失进行图形分析。到目前为止，我已经创建了以下代码： # Create a new instance of the classifier xgbr = xgb.XGBClassifier() # Create a new pipeline with preprocessing steps and model (imballanced learn) pipeline = imb_pipeline([

浏览 3提问于2022-04-21得票数 0

1回答

ROC曲线的建立及logistic回归截断的选择

我正在为二进制分类构建一个逻辑回归分类器。我已经训练过它，打算用ROC曲线来选择一个截止值. 但是它使用的是什么:培训还是验证？

浏览 0提问于2017-12-25得票数 1

回答已采纳

2回答

如何用对角线以下的点来确定ROC曲线？

、、、、

我正在建立接收器操作特性(ROC)曲线，利用曲线下面积(AUC)来评估分类器(更详细的细节)。不幸的是，曲线上的点往往低于对角线。例如，我最后得到了类似于这里的图形(蓝色的ROC曲线，灰色的标识线)：第三个点(0.3，0.2)低于对角线。为了计算AUC，我想修正这样的顽抗点。对于曲线上的点(fp，tp)，标准的方法是用一个点(1-fp，1-tp)代替它，这相当于交换分类器的预测。例如，在我们的示例中，我们的麻烦点A (0.3，0.2)变成了点B (0.7，0.8)，我在链接到上面的图像中用红色表示了这一点。这是在处理这个问题上所做的事情。问题是，如果将新的点添加到新的ROC中(

浏览 14提问于2012-12-09得票数 12

回答已采纳

1回答

python中二进制分类的ROC曲线

、、、

我打算使用RandomForestClassifier绘制一条用于二分类的ROC曲线我有两个numpy数组，一个包含预测值，另一个包含真值，如下所示： In [84]: test Out[84]: array([0, 1, 0, ..., 0, 1, 0]) In [85]: pred Out[85]: array([0, 1, 0, ..., 1, 0, 0]) 如何在ipython中移植ROC曲线并获得此二进制分类结果的AUC (曲线下面积)？

浏览 2提问于2017-03-27得票数 9

回答已采纳

1回答

计算ROC曲线验证分割算法的质量

、、、、

1)假设我有一组100张图片，我手动提取了前景和背景(地面实况)。 2)现在我有了一个分割算法，我将其应用于之前的数据集。结果取决于几个算法参数(假设我进行颜色分割，因此结果取决于所使用的不同颜色空间阈值)。分割的结果是一个二进制掩码。 3)因此，对于这100张图像中的每一张，我都有一个基本事实和一个预测。我可以很容易地计算每个图像的混淆矩阵或所有图像的最终混淆矩阵。我的问题是:如何计算ROC曲线？想法： a)我正在考虑为算法的每个参数都有一条ROC曲线。因此，我保持N-1个参数不变，并以归一化比例0,1改变其他参数。因此，对于0,1中的每个变化，我需要重新运行所有图像的分割，并计算TPR

浏览 1提问于2015-02-05得票数 0