SparkSQL语法及API
一、SparkSql基础语法
1、通过方法来使用
1.查询
df.select("id","name").show();
1>带条件的查询
df.select($"id",...如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为空值。...df.collect //获取当前df对象中的所有数据为一个Array 其实就是调用了df对象对应的底层的rdd的collect方法
2、通过sql语句来调用
1.针对表的操作
1>创建表
df.registerTempTable...("select * from stu").show()
1>带条件的查询
val df = sc.makeRDD(List((1,"a","bj"),(2,"b","sh"),(3,"c","gz")...("select word,count(*) from wordTab group by word").show
二、SparkSql API
可以通过java API使用sparksql。