前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据里有很多重复内容?不同情况不同方法!| PQ实战

数据里有很多重复内容?不同情况不同方法!| PQ实战

作者头像
大海Power
发布2024-04-18 17:05:48
2310
发布2024-04-18 17:05:48
举报

导语:在做多表数据汇总时,经常存在表头行重复的情况,处理这个问题往往需要根据实际情况选择不同的方法。

很多用户为了方便查看自己查看,经常将数据按月、周、部门等等将数据拆分记录,比如下面这个:

这时,如果要进行数据的汇总,就会面临表头行重复的问题,比如,我们将数据加载到Power Query中:

那么,如果要清除这些重复的表头,该怎么办呢?

因为这份数据比较规范,所以,方法也比较简单,这里讲两种,然后再聊聊孰优孰劣的问题。

- 1 -

提升标题再筛选

Step-01 提升标题行

Step-02 筛选去除

这里通过“客户ID”列进行筛选,因为可以同时把空行和合并表头行(如“订单记录(8月)”)等多余内容一并清除。

有时候,删除重复项,不一定要用“删除重复项”的操作!

- 2 -

去重再提升标题

Step-01 先全选表,删除重复项

Step-02 提升标题行

显然,这个方法虽然清除了重复的表头行,但是,对于其他的空行和合并表头行(如“订单记录(8月)”)等多余内容还需要进一步清理。从这个数据本来来说,就会显得步骤更多一些。

- 3 -

孰优孰劣?

单纯从这个问题来说,第一种方法似乎要比第二种方法更好,那是不是说只要学会第一种方法就可以了呢?

其实不能完全这么讲,虽说“条条大路通罗马”,但是,不同的方法可能会适用于不同的情况,当某些细节发生变化时,我们就需要根据细节进行适当的调整。

比如说,如果表中除了表头行,还有些业务数据也记录重复了,那么就无法直接通过筛选来清除,而必须通过去重的方式来实现,因为业务数据本身的重复情况往往不像表头行那样明显唯一。

所以,也不要把某一个方法当套路

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Excel到PowerBI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档