案例分享 | SQL Server删除重复数据只保留一行

需求分析

SQL Server数据库中存在重复记录,删除保留其中一条(是否重复判断基准为多个字段)



解决方案

碰到这样的问题我们先分解步骤来看

  1. 创建测试数据
  2. 找到重复的数据
  3. 删除重复的数据并且保留一行


第一步创建测试数据

我们创建一个人员信息表并在里面插入一些重复的数据。

CREATE TABLE [dbo].[Person](
 [ID] [INT] IDENTITY(1,1) NOT NULL,
 [Name] [VARCHAR](20) NULL,
 [Age] [INT] NULL,
 [Address] [VARCHAR](20) NULL,
 [Sex] [CHAR](2) NULL
);
SET IDENTITY_INSERT [dbo].[Person] ON;
INSERT INTO [dbo].[Person] (ID,Name,Age,Address,Sex)
VALUES
( 1, '张三', 18, '北京路18号', '男' ),
( 2, '李四', 19, '北京路29号', '男' ),
( 3, '王五', 19, '南京路11号', '女' ),
( 4, '张三', 18, '北京路18号', '男' ),
( 5, '李四', 19, '北京路29号', '男' ),
( 6, '张三', 18, '北京路18号', '男' ),
( 7, '王五', 19, '南京路11号', '女' ),
( 8, '马六', 18, '南京路19号', '女' );
SET IDENTITY_INSERT [dbo].[Person]  OFF;



建立好测试数据如下:

案例分享 | SQL Server删除重复数据只保留一行

我们发现除了自增长ID不同以为,有几条其他字段都重复的数据出现,符合我们的需求。


第二步找出重复的数据


SELECT MAX(ID) ID  ,
Name,Age,Address,Sex
FROM dbo.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1


HAVING将分组后统计出来的数量大于1的数据行,就是我们要找的重复数据:

案例分享 | SQL Server删除重复数据只保留一行

上面用Max函数或者Min函数均可,只是为了保证取出来的数据的唯一性。


第三步删除重复的数据

其实我们数据库中最后要保留的结果就是第二步中查询出来的数据,我们把其他的数据删除即可。怎么删除呢?我们使用ID来排除。

DELETE  FROM Person
WHERE  EXISTS
(
SELECT * FROM (
SELECT
MAX(ID) ID,
Name,Age,Address,Sex
FROM dbo.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1) T
WHERE Person.Name=T.Name
AND Person.Age=T.Age
AND Person.Address=T.Address
AND Person.Sex=T.Sex
AND Person.ID--如果上面使用MIN函数,这里就要改成>
)

执行完后重新查询Person表结果如下

案例分享 | SQL Server删除重复数据只保留一行

马六因为只有一条记录,所以没有参与去重,直接显示。

上一篇:解决远程登录mysql数据库报1130错误


下一篇:脚本变量中包含空格的解决办法