1、数据介绍
首先我们产生我们的数据,使用spark sql来产生吧:
val data = Seq[(String,String)](
("{\"userid\":\"1\",\"action...我们使用get_json_object来解析json格式字符串里面的内容,格式如下:
get_json_object(字段名,'$.key')
这里,我们来解析info中的userid和action:...select
get_json_object(info,'$.userid') as user_id,
get_json_object(info,'$.action') as action...(get_json_object(info,'$.action'),'#')[0] as action_type,
split(get_json_object(info,'$.action')...select
get_json_object(info,'$.userid') as user_id,
split(get_json_object(info,'$.action')