PySpark作为Spark的Python接口,使得数据处理和分析更加直观和便捷。...【拓展】链式调用:在编程中将多个方法或函数的调用串联在一起的方式。在 PySpark 中,链式调用非常常见,通常用于对 RDD 进行一系列变换或操作。...例如:from pyspark import SparkConf, SparkContextimport osos.environ['PYSPARK_PYTHON'] = "D:\桌面\Study\Paython...rdd.flatmap(lambda x:x.split(" "))输出结果:'hi', 'python', 'Hello', 'world', 'Happy', 'day'flatMap算子会将结果扁平化为单一列表...1)print(rdd2.collect())sc.stop()输出结果:('小明', 99), ('小城', 99), ('小红', 88), ('小李', 66)【注意】如果多个元素具有相同的键(如这里的