groupBy("列名", ...).sum(列名) 求和
groupBy("列名", ...).count() 求个数
groupBy("列名", ...).agg 可以将多个方法进行聚合...,45),(5,"e","gz",90)));
scala>val df = rdd.toDF("id","name","addr","score");
scala>df.groupBy("addr")....count().show()
scala>df.groupBy("addr").agg(max($"score"), min($"score"), count($"*")).show
4>连接查询
scala... LEFT OUTER子句中指定的左表的所有行,而不仅仅是联接列所匹配的行。...如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为空值。