Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Oracle数据库查询重复数据及删除重复数据方法

Oracle数据库查询重复数据及删除重复数据方法

作者头像
星哥玩云
发布于 2022-08-17 07:25:17
发布于 2022-08-17 07:25:17
5.7K0
举报
文章被收录于专栏:开源部署开源部署

工作中,发现Oracle数据库表中有许多重复的数据,而这个时候老板需要统计表中有多少条数据时(不包含重复数据),只想说一句MMP,库中好几十万数据,肿么办,无奈只能自己在网上找语句,最终成功解救,下面是我一个实验,很好理解。 

假设有一张人员信息表cs(姓名,证件号,地址),将表中三个字段数据都重复的数据筛选出来:

distinct:这个关键字来过滤掉多余的重复数据只保留一条数据

select * from from cs  ------所有字段

select distinct xm,zjh,dz from cs;  -----指定字段

在实践中往往只用它来返回不重复数据的条数,因为distinct对于一个数据量非常大的库来说,无疑是会直接影响到效率的。

-----------------------------------------------------------------------------------------------------------------------

查询重复数据、删除重复数据的方法如下:↓    ↓    ↓   ↓   ↓   ↓   ↓   ↓

①rowid用法: oracle带的rowid属性,进行判断是否存在重复数据。

查询重复数据:

select a.* from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

删除重复数据:

delete from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

②group by :一般用于将查询结果分组,多配合聚合函数,sum,count,min,max,having等一起使用。

查询重复数据:

select max(xm),max(zjh),max(dz),count(xm) as 记录数 from cs group by xm having count(xm)>1    ---------适用于字段少的

select *  from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1)

and rowid not in (select min(rowid) from cs group by xm,zjh,dz  having count(*)>1)   -------适用于多字段

去重重复数据:多个字段,只留有rowid最小的记录 。

delete from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1) and rowid not in (select min(rowid) from cs group by xm,zjh,dz having count(*)>1)

③row_number()over(partition by 列)

select  xm,zjh,dz,row_number()over(partition by zjh order by xm) 记录号 from cs

去重重复数据:

with cs1 as (select  xm,zjh,dz,row_number()over(partition by zjh order by zjh) 记录号 from cs)select * from cs1 where 记录号=1

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
oracle数据库开发优化建议
携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第19天,点击查看活动详情 >>
默默的成长
2022/11/02
5140
oracle数据库去重查询_oracle查询去重数据
oracle数据库中有如下一张表,包含id,loginid,name,researchtime等字段,其中name字段中的数据有重复,查询数据时要重复数据只取一条,利用row_number ()over(partition by 列 order by 列 desc)方法实现
全栈程序员站长
2022/11/10
1.9K0
oracle数据库去重查询_oracle查询去重数据
oracle数据库去重查询_oracle高效去重
方法介绍:distinct 关键字、group by 、row_number ()over(partition by 列 order by 列 desc)
全栈程序员站长
2022/11/10
3.3K0
oracle数据库去重查询_oracle高效去重
sql DISTINCT去掉重复的数据统计方法
sql DISTINCT去掉重复的数据统计方法(2009-01-13 15:05:43)转载 标签:sqldistinct杂谈 分类:sql
零式的天空
2022/03/21
3K0
104-oracle大表删除重复记录的几种方法
如果是小表,随便怎么折腾都行; 如果是大表(至少1千万条记录以上,或者占用10G以上空间), 我们可能需要想办法加快这个速度 , 这时可以参考下面方法:
老虎刘
2023/09/01
7770
104-oracle大表删除重复记录的几种方法
MySQL 如何处理重复数据
有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据。
用户1685462
2021/07/17
2.2K0
SQL中去除重复数据的几种方法,我一次性都告你​
使用SQL对数据进行提取和分析时,我们经常会遇到数据重复的场景,需要我们对数据进行去重后分析。
猴子数据分析
2022/07/13
5.2K0
SQL中去除重复数据的几种方法,我一次性都告你​
去除重复数据
该文介绍了如何去除重复数据的方法,分为完全重复和部分重复。对于完全重复,使用distinct关键字去重;对于部分重复,使用子查询和row_number()分析函数。这些方法适用于不同的数据库系统,如Oracle、MySQL和Hive。
用户1148526
2018/01/03
2K0
oracle中如何删除重复数据
        我们可能会出现这种情况,某个表原来设计不周全,导致表里面的数据数据重复,那么,如何对重复的数据进行删除呢?         重复的数据可能有这样两种情况,第一种时表中只有某些字段一样,第二种是两行记录完全一样。 一、对于部分字段重复数据的删除         先来谈谈如何查询重复的数据吧。         下面语句可以查询出那些数据是重复的:   select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1         将上面的>号改为=号就可以查询出没有重复的数据了。         想要删除这些重复的数据,可以使用下面语句进行删除   delete from 表名 a where 字段1,字段2 in     (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)         上面的语句非常简单,就是将查询到的数据删除掉。不过这种删除执行的效率非常低,对于大数据量来说,可能会将数据库吊死。所以我建议先将查询到的重复的数据插入到一个临时表中,然后对进行删除,这样,执行删除的时候就不用再进行一次查询了。如下:   CREATE TABLE 临时表 AS   (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)         上面这句话就是建立了临时表,并将查询到的数据插入其中。         下面就可以进行这样的删除操作了:   delete from 表名 a where 字段1,字段2 in (select 字段1,字段2 from 临时表);         这种先建临时表再进行删除的操作要比直接用一条语句进行删除要高效得多。        这个时候,大家可能会跳出来说,什么?你叫我们执行这种语句,那不是把所有重复的全都删除吗?而我们想保留重复数据中最新的一条记录啊!大家不要急,下面我就讲一下如何进行这种操作。        在oracle中,有个隐藏了自动rowid,里面给每条记录一个唯一的rowid,我们如果想保留最新的一条记录, 我们就可以利用这个字段,保留重复数据中rowid最大的一条记录就可以了。        下面是查询重复数据的一个例子:   select a.rowid,a.* from 表名 a  where a.rowid !=  (   select max(b.rowid) from 表名 b   where a.字段1 = b.字段1 and   a.字段2 = b.字段2  )        下面我就来讲解一下,上面括号中的语句是查询出重复数据中rowid最大的一条记录。        而外面就是查询出除了rowid最大之外的其他重复的数据了。        由此,我们要删除重复数据,只保留最新的一条数据,就可以这样写了:  delete from 表名 a  where a.rowid !=  (   select max(b.rowid) from 表名 b   where a.字段1 = b.字段1 and   a.字段2 = b.字段2  )        随便说一下,上面语句的执行效率是很低的,可以考虑建立临时表,讲需要判断重复的字段、rowid插入临时表中,然后删除的时候在进行比较。   create table 临时表 as     select a.字段1,a.字段2,MAX(a.ROWID) dataid from 正式表 a GROUP BY a.字段1,a.字段2;   delete from 表名 a  where a.rowid !=  (   select b.dataid from 临时表 b   where a.字段1 = b.字段1 and   a.字段2 = b.字段2  );  commit; 二、对于完全重复记录的删除         对于表中两行记录完全一样的情况,可以用下面语句获取到去掉重复数据后的记录:   select distinct * from 表名   可以将查询的记录放到临时表中,然后再将原来的表记录删除,最后将临时表的数据导回原来的表中。如下:   CREATE TABLE 临时表 AS (select distinct * from 表名);   truncate table 正式表;            --注:原先由于笔误写成了drop table 正式表;,现在已经改正过来   insert into 正式表 (select * from 临时表);   drop table 临时表;
源哥
2018/08/28
2.6K0
Oracle消除重复记录的几种方式
row_number是通过标记排号方式去重,如果有2条或以上的重复数据,直接筛选删除即可。
hankleo
2021/02/25
2.3K0
postgresal去重_postgresql数据库去重方法
通过group by分组,然后将分组后的数据写入临时表然后再写入另外的表,对于没有出现再group by后面的field可以用函数max,min提取,效率较高
全栈程序员站长
2022/11/15
2.3K0
如何正确的使用一条SQL删除重复数据
数据库中表存在重复数据,需要清理重复数据,清理后保留其中一条的情况是比较常见的需求,如何通过1条SQL准确的删除数据呢?
俊才
2022/05/31
1.9K0
如何正确的使用一条SQL删除重复数据
Mysql删除重复数据
[Err] 1093 - You can't specify target table 'dept' for update in FROM clause 原因:更新这个表的同时又查询了这个表,查询这个表的同时又去更新了这个表,可以理解为死锁。mysql不支持这种更新查询同一张表的操作。所以我们用生成临时表去操作,上面的语句就是这么写的。复制即可。
华创信息技术
2020/03/09
17.9K1
SQL如何删除重复数据
SQL如何删除重复数据 在使用数据库时,如何删除重复数据? 如图所示:用户表(user)数据 1、输入查询语句(查询name重复数据) select * from user where name in (select name from user group by name having count(name) > 1) 查询后,可以看到name叫“张三”的有3条数据。 可以使用distinct去重(返回不重复的用户名) select distinct name from user 查询后,
wangmcn
2022/07/26
1.7K0
SQL如何删除重复数据
MySQL 处理重复数据的方式
有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据。
用户9042463
2021/09/30
2.3K0
数据库去重有几种方法_去重数据库
可以看到“ALLEN”和“SMITH”这两个人的数据重复了,现在要求表中name重复的数据只保留一行,其他的删除。
全栈程序员站长
2022/11/10
3.9K0
数据库去重有几种方法_去重数据库
sql语句_ 的三种去重方法
大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说sql语句_ 的三种去重方法,希望能够帮助大家进步!!!
Java架构师必看
2022/01/11
1.1K0
Oracle 分页查询与数据去重深入理解
** 1.无ORDER BY排序的写法。(效率最高)  (经过测试,此方法成本最低,只嵌套一层,速度最快!即使查询的数据量再大,也几乎不受影响,速度依然!) SELECT *
星哥玩云
2022/08/18
1.2K0
巧用 CTE 公共表达式删除 MySQL 重复数据
一段时间后,大多数应用程序可能由于bug而出现重复行,这不仅影响用户体验,还增加了存储需求并降低数据库性能。可以通过一个 SQL 查询来完成整个清理过程,从而有效解决这一问题。
贺春旸的技术博客
2024/10/11
2250
如何删除重复数据
当表设计不规范或者应用程序的校验不够严谨时,就容易导致业务表产生重复数据。因此,学会高效地删除重复就显得尤为重要。
白日梦想家
2020/07/18
2K0
如何删除重复数据
相关推荐
oracle数据库开发优化建议
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档