[Int] = MapPartitionsRDD[1] at map at :28
scala> rdds.collect //查看这个新的RDD,由于RDD并不是一个真正的集合,必须要经过一次从各个...Worker收集才能查看数据
res3: Array[Int] = Array(10, 20, 30, 40, 50, 60, 70, 80, 90, 100)
scala> val rdd3 = rdd.filter...(2))), (kitty,(3,None)), (jerry,(2,Some(9))))
在Drive中直接查看结果,跟保存在hadoop hdfs中相同。...//查看RDD的分区数
res4: Int = 3
这里我们可以看到hadoop hdfs里/usr/file/wcount下面有3个文件,RDD的分区数则为3,如果我们上传一个新的文件进入该文件夹...2个分区,所以这里只有2个part文件,查看结果跟之前collect相同。