----
1.4 DataSet 的 Transformation
1.4.1 map
将DataSet中的每一个元素转换为另一个元素。...示例
使用 map 操作,将以下数据 “1,张三”, “2,李四”, “3,王五”, “4,赵六”,转换为一个 scala 的样例类。...姓名, 国家
姓名, 国家省份
姓名, 国家省份城市
步骤
1) 构建批处理运行环境
2) 构建本地集合数据源
3) 使用 flatMap 将一条数据转换为三条数据...//(scala,1)
}
}
1.4.10 Join
使用 join 可以将两个 DataSet 连接起来。...如果使用小数据集与大数据集进行 join,可以选择 broadcast-forward 策略,将小 数据集广播, 避免代价高的重分区。