#区分是对RDD中的List操作还是对Scala中的List操作
scala> val rdd5 = sc.parallelize(List(List("a b c", "a b b"),List("e...所以第一个flatMap会将任务分发到集群中不同的机器执行,而第二个flatMap会在集群中的某一台机器对某一个List进行计算。...全局聚合后的结果为13
将每个分区内的最大值进行求和,初始值为5
scala> val maxSum = rdd1.aggregate(5)(math.max(_, _), _ + _)
maxSum:...Int = 19
总共有两个分区:分区0为1,2,3,4 分区1为5,6,7,8,9 第一个分区最大值为5(初始值),第二个分区最大值为9,全局聚合后的结果还需与初始值相加,结果为14+5=19...并没有从Worker中的Executor中拉取数据,所以看不到结果,结果可以在spark后台管理界面看到。