这也许是个愚蠢的问题,但我已经挣扎了一段时间了。它确实类似于,但我无法在代码中应用它(双模式或函数)。我希望将一个flatMap (或映射)转换函数传递给一个函数参数,然后将其代理到一个实际调用df.rdd.flatMap方法的策略函数中。我会尽力解释的!我在SparkEntityStrategy上得到了一个错误:
错误:(95,35) T val = this.getData.rdd.map(f = mapFunction)没有可用</em
我是Scala/Spark的新手,希望你们能帮助我。我想在一个hdfs的目录中获取在某个时间戳之后创建的文件,以便在Zeppelin中进行一点监控。中创建一个DataFrame,每个文件都有一行信息(或者至少上面提到的信息)。val data = sc.parallelize(input_files)
val dfFromData2 = spark.createDataFrame(data).toDF()
我有一些spark模型文件,我想加载它们。一种方法是编写以下代码。我只得到了像org.apache.spark.ml.classification.LogisticRegressionModel这样的类名,所以我需要从类名中反射伴生对象,但是我该怎么做呢?From this post,我发现有一种可能坏掉的方法。但是当我尝试时,我发现classMirror中没有companion字段。
在maven构建过程中,我在下面提到的方法中的一个Java类中遇到了这个错误。“无法访问scala.reflect.api.TypeTags not 的scala.reflect.api.TypeTags类文件”
private Dataset<Row> getEmptyDataFramecolumnName) {
StructType st