首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Spark 2.2.0中从管道模型的输出中获取BinaryLogisticRegressionSummary

在Spark 2.2.0中,可以通过以下步骤从管道模型的输出中获取BinaryLogisticRegressionSummary:

  1. 导入必要的库和模块:
代码语言:txt
复制
from pyspark.ml.classification import BinaryLogisticRegressionModel
from pyspark.ml.evaluation import BinaryClassificationEvaluator
  1. 加载训练好的管道模型:
代码语言:txt
复制
model = BinaryLogisticRegressionModel.load("path/to/model")
  1. 获取模型的摘要信息:
代码语言:txt
复制
summary = model.summary
  1. 从摘要中获取BinaryLogisticRegressionSummary:
代码语言:txt
复制
binary_summary = summary.binaryLogisticRegressionSummary

BinaryLogisticRegressionSummary提供了以下属性和方法:

  • areaUnderROC:返回模型的ROC曲线下面积。
  • roc:返回模型的ROC曲线的DataFrame,包含两列:FPR(False Positive Rate)和TPR(True Positive Rate)。
  • pr:返回模型的PR(Precision-Recall)曲线的DataFrame,包含两列:recall和precision。
  • precisionByThreshold:返回不同阈值下的精确度。
  • recallByThreshold:返回不同阈值下的召回率。
  • fMeasureByThreshold:返回不同阈值下的F1值。
  • accuracy:返回模型的准确率。
  • weightedTruePositiveRate:返回加权的真阳性率。
  • weightedFalsePositiveRate:返回加权的假阳性率。
  • weightedFMeasure:返回加权的F1值。
  • numIterations:返回模型的迭代次数。
  • objectiveHistory:返回模型训练过程中的目标函数历史记录。

BinaryLogisticRegressionSummary还提供了以下方法:

  • prAtThreshold:返回给定阈值下的PR曲线上的点。
  • recallAtThreshold:返回给定阈值下的召回率。
  • fMeasureByLabel:返回给定标签下的F1值。
  • precisionByLabel:返回给定标签下的精确度。
  • falsePositiveRateByLabel:返回给定标签下的假阳性率。
  • truePositiveRateByLabel:返回给定标签下的真阳性率。

这些信息可以帮助我们评估模型的性能和效果,并根据需要进行调整和优化。

腾讯云相关产品和产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券