使用Python语言开发Spark程序代码
Spark Standalone的PySpark的搭建----bin/pyspark --master spark://node1:7077
Spark StandaloneHA...将相同Key的Value数据累加操作
6-将结果输出到文件系统或打印
代码:
# -*- coding: utf-8 -*-
# Program function: Spark的第一个程序...[ (‘hello’, 3),(‘Spark’, 2),]
共识:Spark核心或灵魂是rdd,spark的所有操作都是基于rdd的操作
代码:
# -*- coding: utf-8 -*-
# Program...总结
函数式编程
#Python中的函数式编程
#1-map(func, *iterables) --> map object
def fun(x):
return x*x
#x=[1,2,3,4,5...] y=map(fun,[1,2,3,4,5]) #[1, 4, 9, 16, 25]
print(list(map(fun, [1, 2, 3, 4, 5])))
#2-lambda 匿名函数 java