RDD → RDD迭代计算 → RDD导出为列表、元组、字典、文本文件或数据库等。...数据输入:通过 SparkContext 对象读取数据数据计算:将读取的数据转换为 RDD 对象,并调用 RDD 的成员方法进行迭代计算数据输出:通过 RDD 对象的相关方法将结果输出到列表、元组、字典...2, 3, 4, 5'a', 'b', 'c', 'd', 'e', 'f', 'g'1, 2, 3, 4, 5'key1', 'key2'【注意】对于字符串,parallelize 方法会将其拆分为单个字符并存入..., '123456'三、数据输出①collect算子功能:将分布在集群上的所有 RDD 元素收集到驱动程序(Driver)节点,从而形成一个普通的 Python 列表用法:rdd.collect()#...print(type(rdd_list))sc.stop()输出结果:1, 2, 3, 4, 5, 6②reduce算子功能:将 RDD 中的元素两两应用指定的聚合函数,最终合并为一个值