我必须添加一个自定义的条件,它在.withColumn中有很多列。我的场景有点像这样。我必须按行检查许多列是否有空值,并将这些列名添加到新列中。我的代码看起来有点像这样: df= df.withColumn("MissingColumns",\ when(col("firstName").isNull(),lit("firstName")),\
when
我正在和Spark和PySpark一起工作。我正在尝试实现与以下伪代码等效的结果: IF fruit1 == fruit2 THEN 1, ELSE 0.我正在尝试用PySpark来做这件事,但是我不确定它的语法。有什么建议吗?我查看了expr(),但无法让它正常工作。请注意,df是一个pyspark.sql.dataframe.DataFrame。