在pyspark中获得模型的预测,可以按照以下步骤进行:
from pyspark.ml import PipelineModel
model = PipelineModel.load("模型路径")
这里的模型路径是指之前训练好的模型保存在文件系统中的路径。
# 创建一个DataFrame,包含待预测的特征数据
prediction_data = spark.createDataFrame([
(特征1, 特征2, ...),
(特征1, 特征2, ...),
...
], ["特征列1", "特征列2", ...])
需要根据模型训练时使用的特征列进行对应。
predictions = model.transform(prediction_data)
这里的predictions
是一个包含预测结果的DataFrame。
predictions.select("预测结果列").show()
其中,"预测结果列"是在训练模型时指定的预测结果列名称。
这样,你就可以在pyspark中获得模型的预测结果了。
推荐腾讯云相关产品和产品介绍链接地址: 腾讯云提供了强大的大数据和人工智能服务,适用于各种场景和需求。以下是一些相关产品和介绍链接:
以上产品和服务可在腾讯云官网进行详细了解和使用。
领取专属 10元无门槛券
手把手带您无忧上云