在机器学习中,通常可以通过调用模型的 predict_proba
方法来获取预测概率,然后根据预设的阈值将概率转换为类别标签。以下是一个使用 SGDClassifier
的例子,展示了如何从预测概率中得到预测类标签:
from sklearn.linear_model import SGDClassifier
# 初始化分类器,并指定loss为'log'以使用概率模型
classifier = SGDClassifier(loss='log', n_iter_no_change=100)
# 使用训练数据拟合分类器
classifier.fit(train_features, train_labels)
# 对测试集进行预测,得到每个类别的概率
pred_proba = classifier.predict_proba(test_features)
# 假设我们设定的分类阈值为0.5
threshold = 0.5
# 将概率转换为类别标签
predicted_labels = pred_proba >= threshold
在这个例子中,pred_proba
是一个二维数组,其中每个元素代表测试集中每个样本属于每个类别的预测概率。通过比较每个样本的预测概率与阈值,我们可以得到每个样本的预测类别标签。
领取专属 10元无门槛券
手把手带您无忧上云