问题:
编写一个 SQL 查询,来删除 Person 表中所有重复的电子邮箱,重复的邮箱里只保留 Id 最小 的那个。
Id | |
---|---|
1 | john@example.com |
2 | bob@example.com |
3 | john@example.com |
Id 是这个表的主键。
例如,在运行你的查询语句之后,上面的 Person 表应返回以下几行:
Id | |
---|---|
1 | john@example.com |
2 | bob@example.com |
答案
官方:
我们可以使用以下代码,将此表与它自身在电子邮箱列中连接起来。
SELECT p1.*
FROM Person p1,
Person p2
WHERE
p1.Email = p2.Email
然后我们需要找到其他记录中具有相同电子邮件地址的更大 ID。所以我们可以像这样给 WHERE 子句添加一个新的条件。
SELECT p1.*
FROM Person p1,
Person p2
WHERE
p1.Email = p2.Email AND p1.Id > p2.Id
因为我们已经得到了要删除的记录,所以我们最终可以将该语句更改为 DELETE。
DELETE p1 FROM Person p1,
Person p2
WHERE
p1.Email = p2.Email AND p1.Id > p2.Id
网友1:
DELETE FROM Person WHERE id NOT IN
( SELECT * FROM ( SELECT MIN( id ) FROM Person GROUP BY Email ) t);
先分组查询最小的id,删除查询出的id以外的。
PS:当子查询查询结果是null时,not in 会有问题,可以用 not EXISTS。
网友2
两种方法:
第一种分组通过min()取出每组最小的Id :
delete from person where Id not in (select Id from (select min(Id) Id from person group by Email) h);
第二种先排序再分组取出最小的Id :
delete from person where Id not in (select Id from (select Id from (select Id,Email from person order by Id) h group by Email) z);
第二种虽然长一点复杂一点但是运行时间短一点
原文链接:https://leetcode-cn.com/problems/delete-duplicate-emails