我正在使用PySpark在木星上的Azure。我试图使用UDF在dataframe上进行测试,但是UDF没有执行。在下一个单元格中,我尝试执行一个简单的udf。def iterateMeals(user):这不会产生任何输出。我希望数据文件中的每一项都会被打印出来。我还试过使用pyspark.sql.functions
from
当从终端运行以下简单脚本时,它在pyspark中工作得很好:foo = sc.parallelize([1,2])但是当在Rodeo中运行时,它会产生一个错误,其中最重要的一行是:
Exception: Python in worker has different version2.7 than that in driver 3.5, PySpark<