我正在尝试使用我在Kaggle上找到的住房数据集在PySpark中做一个非常简单的LinearRegression。evaluator=ev, model = cv.fit(data).bestModel: java.lang.NullPointerException
at org.apache.<e
我正在学习如何使用Spark DataFrames API在scala中构建机器学习模型,并想知道可以用于优化模型的所有超参数的列表。通过搜索到目前为止,我找到了一些LinearRegression的超参数,例如:
import org.apache.spark.ml.regression.LinearRegression
val lr =
我正在尝试使用org.apache.spark.ml.regression.LinearRegression来拟合我的数据。因此,我已经将原始的RDD转换为dataframe,并尝试将其提供给linearRegression模型。, true) parsedData,)
val lr = new LinearRegression0.0,1.0,0.0]|