我有一个列名列表,每次列名都不同。列名存储在列表中。因此,我需要传递列表中的列名(在下面的示例中,列名是其id和programid id),以便在源数据帧和目标数据帧之间进行比较。from pyspark import SparkContext, SparkConf, SQLContext
from pyspark.sql.functions i
对于每个子段,过滤条件可在底层字典中用于子段,即a,b,c,d,f。此外,子段字典键的筛选条件也是pyspark dataframe的列名。我想要为每个段一次创建吡火花数据帧中的子段列,当满足筛选条件时,每个子段列的值为1,否则0,类似于, pyspark_dataframe.withColumnwhen(meeting filter criteria with respect to each key), 1).otherwise(0