两者的区别
删除时,内部表把元数据和具体数据都删除,而外部表只删除元数据。...student
-- 导入,并覆盖所有表中数据
load data local inputpath '/opt/student.txt' overwrite into table student;
-- 建表时通过...'\\d+';
Distinct 去重
会将数据放入同一个Reducer,可能会报内存溢出,数据量大时慎用
-- 无论这个年龄段人数有多少,去重后只显示1个
select age,count(distinct...WHEN 语句
-- 判断,如果gender为'男'或'女',分别设置1,最后统计每个年龄段男女人数
select
age,
sum(case gender when '男' then 1 else 0...IF 语句
-- 以下代码等价于上面的case when
select
age,
sum(if(gender='男',1,0)) male_count,
sum(if(gender='女',1,0))