处理SQL Server中的重复行

处理SQL Server中的重复行

如果表中的数据需要基于行中的多个值具有唯一约束,则适合的解决方案将是复合健。

复合主键

使用SQL Server语法创建符合主键非常简单。

create table my_parts
(
id_part1 int not null,
id_part2 int not null,
id_part3 int not null,
primary key(id_part1,id_part2,id_part3)
)
GO

在已经存在的表的情况下,通过简单的查询,复合键约束也很容易。

ALTER TABLE my_parts
  ADD PRIMARY KEY (id_part1, id_part2,id_part3);
GO

但是对于传统的现有系统,当您不允许在正在生产的系统中进行大的更改时,您必须通过简单地找到它们然后从表数据中删除它们来处理重复项。

这可能是一个真正的头痛,特别是如果现有数据对于实时系统运行至关重要

首先要找到重复的东西。

SELECT  id_part1 ,
id_part2 ,
id_part3 ,
COUNT(*) AS [count]
FROM dbo.my_parts (NOLOCK)GROUP BY id_part1 ,
id_part2 ,
id_part3
HAVING COUNT(*) > 1;

复合唯一约束

在某些情况下,您可能有一个表的主键和一个复合键。在这种情况下,查找重复的查询对你没有什么用,因为您将获得所有复合键值的重复数量,但由于主键对于每一行都是唯一的,因此您不能通过在查询中包含主键来进行分组。

要获得这样的tbale,你需要采用一种不同的方法来创建它,以防你从头开始。

CREATE TABLE my_parts
(
id INT IDENTITY(1,1) NOT NULL,
id_part1 INT NULL ,
id_part2 INT NULL ,
id_part3 INT NULL ,
PRIMARY KEY CLUSTERED (id),
CONSTRAINT [CK_my_parts] UNIQUE (id_part1,id_part2,id_part3)
);
GO

如果您正在处理现有数据库,该数据库已经包含要包含在复合唯一约束中的列值的重复项,则在添加约束之前,您需要从重复项中清除表。只有这样,您才能使用现有数据将复合唯一contrsint添加到existig表中。

DELETE  FROM dbo.my_parts
WHERE id NOT IN ( SELECT MIN(id)
FROM dbo.my_parts
GROUP BY id_part1 ,
id_part2 ,
id_part3 );
上一篇:bash 学习笔记


下一篇:深入理解 path-to-regexp.js 及源码分析