四,RDD,DataFrame和DataSet的相互转换
Spark的RDD,DataFrame和DataSet三种数据结构之间可以相互转换。
?
?
?
?
?...六,DataFrame的API交互
DataFrame和DataSet具有完全相同的API,此处演示DataFrame常用的一些API使用。...1,Action操作
DataFrame的Action操作包括show,count,collect,collectAsList,describe,take,takeAsList,head,first等...2,类RDD操作
DataFrame支持RDD常用的map,flatMap,filter,reduce,distinct,cache,sample,mapPartitions,foreach,intersect...其中UDAF由分为弱类型UDAF和强类型UDAF,前者可以在DataFrame,DataSet,以及SQL语句中使用,后者仅可以在DataSet中使用。
1,普通UDF
?
?