sqlserver 分区表总结

2023-01-08 12:24:42

一些结论：

1、分区字段不一定需要建立索引
2、分区字段可建索引：clustered 、noclustered
3、不论分区字段的索引方式，若重建为clustered且没有关联分区方案时，分区表就变成了非分区表
4、普通表转换为分区表，只要在该表创建一个clustered索引，并在该clustered索引上使用分区方案即可
5、分区表转换为普通表，分区字段新建clustered索引且不关联分区方案
6、分区表创建唯一性约束，必须包含分区列
7、创建分区方案时，必须保证文件组数量匹配分区函数的分区范围段，文件组名称可重复，也可使用ALL(即一个文件组)，则所有分区均落在这  个文件组中
8、分区函数和分区方案是面对数据库里的，不是整个实例的
9、分区表占用磁盘大，删除字段后仍不会变化，进行分区合并或转换为普通表，则会降低磁盘消耗

创建分区表步骤：

建立文件组(类似oracle表空间)->创建分区函数(确定数据分区范围)->创建分区方案，关联分区函数/文件组->建立表，关联分区方案

1.1、建立文件组的示例

alter database test1 add filegroup part1;
alter database test1 add filegroup part1000;
alter database test1 add filegroup part2000;
alter database test1 add filegroup part3000;
alter database test1 add filegroup part4000;

1.2、建立文件的示例，关联文件组

ALTER DATABASE test1 ADD FILE(NAME = test1part1,FILENAME = 'G:\test1part1.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB) TO FILEGROUP part1;
ALTER DATABASE test1 ADD FILE(NAME = test1part1000,FILENAME = 'G:\test1part1000.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB) TO FILEGROUP part1000;
ALTER DATABASE test1 ADD FILE(NAME = test1part2000,FILENAME = 'G:\test1part2000.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB) TO FILEGROUP part2000;
ALTER DATABASE test1 ADD FILE(NAME = test1part3000,FILENAME = 'G:\test1part3000.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB) TO FILEGROUP part3000;
ALTER DATABASE test1 ADD FILE(NAME = test1part4000,FILENAME = 'G:\test1part4000.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB) TO FILEGROUP part4000;

2、建立分区函数的示例，分区函数名为partfun1

-- VALUES ('1000','2000','3000','4000')表明，将把表分为5个区了，是从根据表字段的值的大小来分区，五个区分别是最小--1000,1000-2000,2000-3000,3000-4000,4000-最大

CREATE PARTITION FUNCTION partfun1 (int) AS RANGE LEFT FOR VALUES ('1000','2000','3000','4000')

3、建立方案的例子,关联分区函数partfun1，关联文件组

-- 建立在part1,part1000,part2000,part3000,part4000几个文件组上

CREATE PARTITION SCHEME partschema1 AS PARTITION partfun1 TO (part1,part1000,part2000,part3000,part4000);

-- 建立在part1、[PRIMARY]文件组上，把part1换成[PRIMARY]也没问题，这样就类似都建立在[PRIMARY]文件组上

CREATE PARTITION SCHEME partschema2 AS PARTITION partfun1 TO (part1,[PRIMARY],[PRIMARY],[PRIMARY],[PRIMARY]);

-- 都建立在part1文件组上

CREATE PARTITION SCHEME partschema3 AS PARTITION partfun1 ALL TO (part1);

-- 都建立在[PRIMARY]文件组上

CREATE PARTITION SCHEME partschema4 AS PARTITION partfun1 ALL TO ([PRIMARY]);

4、建立分区表的示例

CREATE TABLE parttable1(
[ID] [int] NOT NULL,
[IDText] [nvarchar](max) NULL,
[Date] [datetime] NULL)
ON [partschema1](ID);

insert into parttable1 values (1,'1',getdate()-4);
insert into parttable1 values (1001,'1001',getdate()-3);
insert into parttable1 values (2001,'2001',getdate()-2);
insert into parttable1 values (3001,'3001',getdate()-1);
insert into parttable1 values (4001,'4001',getdate());

5、验证分区表的数据

-- 返回分区表所有行

SELECT * FROM parttable1;

-- 返回ID字段值为4的行属于哪个分区

SELECT distinct $PARTITION.[partfun1](4) FROM parttable1;

-- 返回第2个分区的所有行,ID就是分区字段ID

SELECT * FROM parttable1 where $PARTITION.[partfun1](ID)=2;

注意：不能因为SELECT * FROM parttable1 where $PARTITION.partfun1=2有结果就说明它是分区表，本文最后试验7该表是非分区表了，但是执行SELECT * FROM parttable1 where $PARTITION.partfun1=2还是有结果的

新增分区

1、为分区方案指定一个可以使用的文件组(新增分区方案的文件组)。

2、修改分区函数(新增分区函数的数据范围)

ALTER PARTITION SCHEME partschema1 NEXT USED [PRIMARY]

ALTER PARTITION FUNCTION partfun1() SPLIT RANGE ('4500')

select p.partition_number,p.rows from sys.indexes i inner join sys.partitions p on p.object_id = i.object_id and i.object_id = object_id('parttable2') order by 1

--第一条语句，如果分区方案使用的ALL TO ([PRIMARY])，则这条语句不用执行
--第二条语句新增一个分区，范围是4000-4500
--第三条语句验证新增分区是否存在，是否存在行数

删除\合并分区

-- 就把1000-2000这个分区，删除了，合并成了1000-3000

ALTER PARTITION FUNCTION partfun1() MERGE RANGE ('2000')

-- 无法像oracle一样执行ALTER TABLE TABLENAME DROP PARTITION PARTITIONNAME;

删除分区表及对应的文件组

删除顺序为：删除分区表、删除分区方案、删除分区函数，最后删除文件组，删除完文件组后对应的文件也就删除了

分区表转换为普通表，普通表转换为分区表的示例

DROP TABLE parttable1;

CREATE TABLE parttable1(
	[Id] [int] IDENTITY(1,1) NOT NULL,
	[Name] [varchar](16) NOT NULL,
	[Id2][int] NOT NULL
) ON partschema1(Id2);

insert into parttable1 values ('1',1);
insert into parttable1 values ('1001',1001);
insert into parttable1 values ('2001',2001);
insert into parttable1 values ('3001',3001);
insert into parttable1 values ('4001',4001);

1、在分区表上创建的唯一约束，必须包含分区列。

ALTER TABLE parttable1 ADD CONSTRAINT PK_prattable1_id PRIMARY KEY CLUSTERED ([ID] ASC)

报错Column 'Id2' is partitioning column of the index 'PK_prattable1_id'. Partition columns for a unique index must be a subset of the index key.

2、分区列id2新建clustered索引，parttable1还是分区表

create clustered index CI_prattable1_id2 on parttable1(id2);

3、分区列id2创建nonclustered索引，parttable1还是分区表

drop index CI_prattable1_id2 on parttable1;
create nonclustered index NCI_prattable1_id2 on parttable1(id2);

4、非分区列id列创建clustered索引，parttable1还是分区表，说明非分区列可以是cluster索引列

create clustered index CI_prattable1_id on parttable1(id);

5、分区列id2重建为nonclustered索引并且不使用分区方案，parttable1还是分区表

create nonclustered index NCI_prattable1_id2 on parttable1(id2) WITH (DROP_EXISTING = ON) ON [PRIMARY];

6、分区列id2重建为clustered索引不加ON条件，parttable1还是分区表

drop index CI_prattable1_id on parttable1;
drop index NCI_prattable1_id2 on parttable1;
create clustered index CI_prattable1_id2 on parttable1(id2);
create clustered index CI_prattable1_id2 on parttable1(id2) WITH (DROP_EXISTING = ON);

7、分区列id2重建为clustered索引加上ON条件但不使用分区方案，parttable1变成了非分区表

create clustered index CI_prattable1_id2 on parttable1(id2) WITH (DROP_EXISTING = ON) ON [PRIMARY];

8、分区列id2重建为clustered索引并且使用分区方案，parttable1变成了分区表

create clustered index CI_prattable1_id2 on parttable1(id2) WITH (DROP_EXISTING = ON) on partschema1(Id2);

9、删掉上面8的clustered索引后，parttable1还是分区表

drop index CI_prattable1_id2 on parttable1;

10、分区列id2新建为clustered索引并且不使用分区方案，parttable1变成了非分区表

create clustered index CI_prattable1_id2 on parttable1(id2) ON [PRIMARY];

11、删掉上面10的clustered索引后，parttable1还是非分区表

drop index CI_prattable1_id2 on parttable1;

12、分区列id2新建为nonclustered索引，虽然使用了分区方案，还是非分区表

create nonclustered index NCI_prattable1_id2 on parttable1(id2) on partschema1(Id2);

分区表转换为普通表，遇到分区字段是主键的情况下，则删除主键约束，再对原来主键的字段重建cluster索引或重建为主键，但是都不关联分区方案

ALTER TABLE Table_name DROP CONSTRAINT PK_NAME WITH (>
CREATE CLUSTERED INDEX PK_NAME ON Table_name(column)  WITH (ON [PRIMARY];

或

ALTER TABLE Table_name ADD CONSTRAINT PK_NAME PRIMARY KEY CLUSTERED(column) WITH (ON [PRIMARY];

普通表转换为分区表，要保留原来的主键的情况下，则删除主键约束，再创建主键但不设为聚集索引，再创建新的聚集索引，在该聚集索引中使用分区方案

ALTER TABLE Table_name DROP CONSTRAINT PK_NAME WITH (>
ALTER TABLE Table_name ADD CONSTRAINT PK_NAME PRIMARY KEY NONCLUSTERED(column) WITH (ON [PRIMARY];

--创建主键，但不设为聚集索引

CREATE CLUSTERED INDEX index_name ON Table_name(column) ON 分区方案(分区字段)

--创建一个新的聚集索引，在该聚集索引中使用分区方案

查询某张分区表的总行数和大小，比如表为crm.EmailLog

exec sp_spaceused 'crm.EmailLog';

查询某张分区表的信息，每个分区有多少行，比如表为crm.EmailLog

select convert(varchar(50), ps.name
) as partition_scheme,
p.partition_number,
convert(varchar(10), ds2.name
) as filegroup,
convert(varchar(19), isnull(v.value, ''), 120) as range_boundary,
str(p.rows, 9) as rows
from sys.indexes i
join sys.partition_schemes ps on i.data_space_id = ps.data_space_id
join sys.destination_data_spaces dds
on ps.data_space_id = dds.partition_scheme_id
join sys.data_spaces ds2 on dds.data_space_id = ds2.data_space_id
join sys.partitions p on dds.destination_id = p.partition_number
and p.object_id = i.object_id and p.index_id = i.index_id
join sys.partition_functions pf on ps.function_id = pf.function_id
LEFT JOIN sys.Partition_Range_values v on pf.function_id = v.function_id
and v.boundary_id = p.partition_number - pf.boundary_value_on_right
WHERE i.object_id = object_id('crm.EmailLog')
and i.index_id in (0, 1)
order by p.partition_number

查询分区函数

select * from sys.partition_functions

查看分区架构

select * from sys.partition_schemes

码农公寓

相关文章