题目地址:https://leetcode-cn.com/problems/delete-duplicate-emails/
编写一个 SQL 查询,来删除Person表中所有重复的电子邮箱,重复的邮箱里只保留Id最小的那个。
+----+------------------+
| Id | Email |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
| 3 | john@example.com |
+----+------------------+
Id 是这个表的主键。
例如,在运行你的查询语句之后,上面的 Person 表应返回以下几行:
+----+------------------+
| Id | Email |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
+----+------------------+
提示: 执行 SQL 之后,输出是整个 Person表。 使用 delete 语句。
题意:在表中删除重复的数据,并且留下的必须是id最小的
一、表关联直接删除法
先将表关联后找到需要删除的对象
执行结果如下:
22 / 22 个通过测试用例
状态:通过
执行用时: 1792 ms
内存消耗: 0 B
二、groupby法
groupby后找到min id 然后删除id not in 这些id的值即可。
执行结果如下:
22 / 22 个通过测试用例
状态:通过
执行用时: 1100 ms
内存消耗: 0 B
// 时间60%
DELETE p1 FROM Person p1,
Person p2
WHERE
p1.Email = p2.Email AND p1.Id > p2.Id
// 时间更少 92%
delete from Person
where Id not in(select Id from (
select min(Id) Id,Email
from Person
group by Email)t)