背景
前段时间学习《Microsoft SQL Server 2008技术内幕:T-SQL查询》时,看到里面关于无序GUID作为主键与聚集索引的建议,无序GUID作为主键以及作为聚集索引所带来的问题包括:
- 空间的浪费以及由此带来的读写效率的下降。
- 更主要的,存储的碎片化(fragmentation)以及由此带来的读写效率严重下降。
所以,尽量避免用GUID(无序或有序)做主键,不要用无序GUID做聚集索引。<摘自博友博客>
想到在工作中存在一个视图转成物理表的时候使用到了此种场景,分析了一下数据情况,已经有较多客户此表的数据将近百万级,后续会继续线性增长,而且在代码规范也强制要求不允许使用无序GUID,需要调整为有序的GUID,对于修改前后的表现,还是想做一个对比分析...
一、插入无序GUID数据
--创建表并插入无序GUID数据
--DROP TABLE T_PROORDERTYPEGUIDTEST;
create table T_PROORDERTYPEGUIDTEST (
FENTRYID varchar(36) not null default ' ',
FPROORDERENTRYID int not null default 0,
FPROORDERTYPE varchar(20) not null default ' ',
FFORMID varchar(36) not null default ' ',
FNUMBER nvarchar(160) not null default ' ',
FCREATEORGID int not null default 0,
FUSEORGID int not null default 0,
FDOCUMENTSTATUS char(1) not null default 'C',
FFORBIDSTATUS char(1) not null default 'A',
FDATE datetime not null default getdate(),
FMATERIALID int not null default 0,
FBOMID int not null default 0,
FAUXPROPID int not null default 0,
FLOT int not null default 0,
FMtoNo nvarchar(200) not null default '',
FSEQ int not null default 0,
FUNITID int not null default 0,
FPRODUCTID int not null default 0,
FWORKSHOPID int not null default 0,
FCOSTCENTERID int not null default 0,
constraint PK_PROORDERTYPE primary key (FENTRYID)
)
--插入500000条数据
declare @i int
set @i = 1
while @i < 500000
begin
INSERT INTO T_PROORDERTYPEGUIDTEST(FENTRYID,FPROORDERENTRYID,FPROORDERTYPE,FFORMID,FNUMBER,FCREATEORGID,
FUSEORGID,FDOCUMENTSTATUS,FFORBIDSTATUS,FDATE,FMATERIALID,FBOMID,FAUXPROPID,FLOT,
FSEQ,FUNITID,FPRODUCTID,FWORKSHOPID,FCOSTCENTERID) values
(NEWID(),@i,'PO','FORM_OUTSRCPROORDER','TEST00001',@i,@i,'C','A',GETDATE(),@i,@i,@i,@i,@i,@i,@i,@i,@i)
SET @i=@i+1
end ; select COUNT(1) from T_PROORDERTYPEGUIDTEST
二、插入有序GUID数据
--创建表并插入有序GUID数据
DROP TABLE T_PROORDERTYPESEQGUIDTEST;
create table T_PROORDERTYPESEQGUIDTEST (
FENTRYID uniqueidentifier not null default (NEWSEQUENTIALID()),
FPROORDERENTRYID int not null default 0,
FPROORDERTYPE varchar(20) not null default ' ',
FFORMID varchar(36) not null default ' ',
FNUMBER nvarchar(160) not null default ' ',
FCREATEORGID int not null default 0,
FUSEORGID int not null default 0,
FDOCUMENTSTATUS char(1) not null default 'C',
FFORBIDSTATUS char(1) not null default 'A',
FDATE datetime not null default getdate(),
FMATERIALID int not null default 0,
FBOMID int not null default 0,
FAUXPROPID int not null default 0,
FLOT int not null default 0,
FMtoNo nvarchar(200) not null default '',
FSEQ int not null default 0,
FUNITID int not null default 0,
FPRODUCTID int not null default 0,
FWORKSHOPID int not null default 0,
FCOSTCENTERID int not null default 0,
constraint PK_SEQPROORDERTYPE primary key (FENTRYID)
)
--插入500000条数据
declare @i int
set @i = 1
while @i < 500000
begin
INSERT INTO T_PROORDERTYPESEQGUIDTEST(FPROORDERENTRYID,FPROORDERTYPE,FFORMID,FNUMBER,FCREATEORGID,
FUSEORGID,FDOCUMENTSTATUS,FFORBIDSTATUS,FDATE,FMATERIALID,FBOMID,FAUXPROPID,FLOT,
FSEQ,FUNITID,FPRODUCTID,FWORKSHOPID,FCOSTCENTERID) values
(@i,'PO','FORM_OUTSRCPROORDER','TEST00001',@i,@i,'C','A',GETDATE(),@i,@i,@i,@i,@i,@i,@i,@i,@i)
SET @i=@i+1
end ; select COUNT(1) from T_PROORDERTYPESEQGUIDTEST
三、分析索引碎片
--分析索引碎片
declare @table_id int
set @table_id=object_id('T_PROORDERTYPEGUIDTEST')
dbcc showcontig(@table_id);
DBCC SHOWCONTIG 正在扫描 'T_PROORDERTYPEGUIDTEST' 表...
表: 'T_PROORDERTYPEGUIDTEST' (410536596);索引 ID: 1,数据库 ID: 8
已执行 TABLE 级别的扫描。
- 扫描页数................................: 13933
- 扫描区数..............................: 1759
- 区切换次数..............................: 13932
- 每个区的平均页数........................: 7.9
- 扫描密度 [最佳计数:实际计数].......: 12.50% [1742:13933]
- 逻辑扫描碎片 ..................: 99.22%
- 区扫描碎片 ..................: 0.11%
- 每页的平均可用字节数.....................: 2569.6
- 平均页密度(满).....................: 68.25%
DBCC 执行完毕。如果 DBCC 输出了错误信息,请与系统管理员联系。
declare @table_id int
set @table_id=object_id('T_PROORDERTYPESEQGUIDTEST')
dbcc showcontig(@table_id)
DBCC SHOWCONTIG 正在扫描 'T_PROORDERTYPESEQGUIDTEST' 表...
表: 'T_PROORDERTYPESEQGUIDTEST' (1114539104);索引 ID: 1,数据库 ID: 8
已执行 TABLE 级别的扫描。
- 扫描页数................................: 8197
- 扫描区数..............................: 1033
- 区切换次数..............................: 1032
- 每个区的平均页数........................: 7.9
- 扫描密度 [最佳计数:实际计数].......: 99.23% [1025:1033]
- 逻辑扫描碎片 ..................: 0.67%
- 区扫描碎片 ..................: 0.10%
- 每页的平均可用字节数.....................: 44.3
- 平均页密度(满).....................: 99.45%
DBCC 执行完毕。如果 DBCC 输出了错误信息,请与系统管理员联系。
四、占用空间情况
sp_spaceused 'T_PROORDERTYPEGUIDTEST';
sp_spaceused 'T_PROORDERTYPESEQGUIDTEST';
五、查询执行情况
select * from T_PROORDERTYPEGUIDTEST ;
select * from T_PROORDERTYPESEQGUIDTEST ;
再分别插入50W数据
declare @i int
set @i = 1
while @i < 500000
begin
INSERT INTO T_PROORDERTYPEGUIDTEST(FENTRYID,FPROORDERENTRYID,FPROORDERTYPE,FFORMID,FNUMBER,FCREATEORGID,
FUSEORGID,FDOCUMENTSTATUS,FFORBIDSTATUS,FDATE,FMATERIALID,FBOMID,FAUXPROPID,FLOT,
FSEQ,FUNITID,FPRODUCTID,FWORKSHOPID,FCOSTCENTERID) values
(NEWID(),@i,'PO','FORM_OUTSRCPROORDER','TEST00001',@i,@i,'C','A',GETDATE(),@i,@i,@i,@i,@i,@i,@i,@i,@i)
SET @i=@i+1
end ; declare @i int
set @i = 1
while @i < 500000
begin
INSERT INTO T_PROORDERTYPESEQGUIDTEST(FPROORDERENTRYID,FPROORDERTYPE,FFORMID,FNUMBER,FCREATEORGID,
FUSEORGID,FDOCUMENTSTATUS,FFORBIDSTATUS,FDATE,FMATERIALID,FBOMID,FAUXPROPID,FLOT,
FSEQ,FUNITID,FPRODUCTID,FWORKSHOPID,FCOSTCENTERID) values
(@i,'PO','FORM_OUTSRCPROORDER','TEST00001',@i,@i,'C','A',GETDATE(),@i,@i,@i,@i,@i,@i,@i,@i,@i)
SET @i=@i+1
end ;
参考文章
http://msdn.microsoft.com/zh-cn/library/ms175008(v=sql.90).aspx
http://msdn.microsoft.com/zh-cn/library/ms188776.aspx
http://www.sqlskills.com/blogs/kimberly/disk-space-is-cheap/
http://www.cnblogs.com/zhouruifu/archive/2012/04/18/2454088.html
Microsoft SQL Server 2008技术内幕:T-SQL查询