中的每个元素及元素嵌套的子元素 , 并返回一个 新的 RDD 对象 ;
2、解除嵌套
解除嵌套 含义 : 下面的的 列表 中 , 每个元素 都是一个列表 ;
lst = [[1, 2], [3, 4,...5], [6, 7, 8]]
如果将上述 列表 解除嵌套 , 则新的 列表 如下 :
lst = [1, 2, 3, 4, 5, 6, 7, 8]
RDD#flatMap 方法 先对 RDD 中的 每个元素...进行处理 , 然后再 将 计算结果展平放到一个新的 RDD 对象中 , 也就是 解除嵌套 ;
这样 原始 RDD 对象 中的 每个元素 , 都对应 新 RDD 对象中的若干元素 ;
3、RDD#flatMap...旧的 RDD 对象 oldRDD 中 , 每个元素应用一个 lambda 函数 , 该函数返回多个元素 , 返回的多个元素就会被展平放入新的 RDD 对象 newRDD 中 ;
代码示例 :
# 将 字符串列表...,将每个元素 按照空格 拆分
rdd2 = rdd.flatMap(lambda element: element.split(" "))
# 打印新的 RDD 中的内容
print(rdd2.collect