类型 RDD 对象 数据 中 相同 键 key 对应的 值 value 进行分组 ,
然后 , 按照 开发者 提供的 算子 ( 逻辑 / 函数 ) 进行 聚合操作 ;
上面提到的 键值对 KV 型 的数据...和 ("Jerry", 13) 分为一组 ;
如果 键 Key 有 A, B, C 三个 值 Value 要进行聚合 , 首先将 A 和 B 进行聚合 得到 X , 然后将 X 与 C 进行聚合得到新的值...Y ;
具体操作方法是 : 先将相同 键 key 对应的 值 value 列表中的元素进行 reduce 操作 , 返回一个减少后的值,并将该键值对存储在RDD中 ;
2、RDD#reduceByKey...中 ,
然后 按照空格分割开 再展平 , 获取到每个单词 ,
根据上述单词列表 , 生成一个 二元元组 列表 , 列表中每个元素的 键 Key 为单词 , 值 Value 为 数字 1 ,
对上述 二元元组...列表 进行 聚合操作 , 相同的 键 Key 对应的 值 Value 进行相加 ;
2、代码示例
首先 , 读取文件 , 将 文件转为 RDD 对象 , 该 RDD 对象中 , 列表中的元素是 字符串