qd_title都提取出来转换成hive中的array数组。...下面介绍两种方法
法一get_json_object+正则
1.首先可以使用get_json_object函数,提取出数组,但是这个返回的是一个字符串
select get_json_object('{...,只是一个字符串
["网红打卡地","看青山游绿水"]
2.将字符串中的[ ] "都去掉,形成一个,分割的字符串
regexp_replace('${刚刚得到的字符串}','(\\[|\\]|")','...LATERAL VIEW 打平数组进行统计
SELECT qdtitle,COUNT(DISTINCT uuid) uv
FROM ba_travel.bas_log_sdk_mt_mv a LATERAL...'],'$.viewdata[*].qd_title'),'(\\[|\\]|")',''),",")) b AS qdtitle
GROUP BY qdtitle
法二 正则匹配
1.观察json数组中每一个元素都是由