我在理解foreach循环中group by group_name是如何工作的时候遇到了麻烦。grouped_data中的每条记录。下面是这样写的: GENERATE group AS grp,SUM(dataset.worked_hours) AS hours ;
我搞不懂最后一行是怎么回事,尤其是</
我的数据目录中有50个文本文件(路径:/home/admin/Desktop/ data )。我的任务是扁平化(标记化)文本文件中的数据,并将输出存储在50个输出文件中。下面是我为完成这项工作而建立的关系:
--This will load all the 50 text files.B = FOREACH A GENERATE FLATTEN(TOKENIZE</em