我们都知道,提高sql server的数据查询速度,最有效的方法,就是为表创建索引,而索引在对数据进行新增,删除,修改的时候,会产生索引碎片,索引碎片多了,就需要重新组织或重新生成索引,以达到索引的最大效率。
那么我们要如何知道索引的碎片大小呢?在sql server中,碎片的大小是使用碎片比来体现的,按msdn上面的说法,如果碎片比小于30%,我们可以重新组织索引,如果碎片比大于等于30%,我们可以选择重新生成索引。
那么我们在那里可以查看到碎片比呢?最简单的就是在microsoft sql server management studio中选择:要查看的索引所在的表- >"索引",选择要查看的索引,选择"重新生成"或者"重新组织",在弹出框的"碎片总计"栏中,显示的就是该索引的碎片比了。
当然,在本文中,我们主要是要讲解通过sys.dm_db_index_physical_stats动态函数来查看索引的碎片比率。
先看看sys.dm_db_index_physical_stats的定义:
解释一下:
database_id--要查看索引所在数据库,当前数据库ID我们可以用db_id()函数来取到
object_id--要查索引所在表的id,比如我们要查看表T1,可以用object_id('T1')来取到该表的ID
index_id--要查看索引的索引号,该索引也同样可以用object_id('索引名')来获取
partition_number--对象中的分区号。partition_number为int类型。有效的输入包括索引或堆的 partion_number 或 NULL
mode--在msdn中的解释是这样的:
函数的执行模式将确定为了获取此函数所使用的统计信息数据而执行的扫描级别。mode 被指定为 LIMITED、SAMPLED 或 DETAILED。此函数将遍历构成表或索引的指定分区的分配单元页链。
LIMITED:模式运行最快,扫描的页数最少。对于堆,它将扫描所有页,但对于索引,则只扫描叶级上面的父级别页。
SAMPLED:模式将返回基于索引或堆中所有页的 1% 样本的统计信息。如果索引或堆少于 10,000 页,则使用DETAILED模式代替 SAMPLED。
DETAILED:模式将扫描所有页并返回所有统计信息。
从 LIMITED 到 DETAILED 模式,速度将越来越慢,因为在每个模式中执行的任务越来越多。若要快速测量表或索引的大小或碎片级别,请使用 LIMITED 模式。它的速度最快,并且对于索引的IN_ROW_DATA 分配单元中的每个非叶级别,不返回与其对应的一行。
下面通过示例来查看:
比如我要查看当前数据库的Assets_BackUp_Assets表的索引情况,可以用以下的语句查询:
解释一下几个比较有用返回列:
database_id:当前数据库ID,也就是db_id()
object_id列:当前表的ID,也就是object_id('Assets_BackUp_Assets')
index_id列:当前索引的ID,假如Assets_BackUp_Assets中有两个索引,index_id分别为1和2,如果我们只想查看索引1的情况,可以用
select * from sys.dm_db_index_physical_stats(db_id(),object_id('Assets_BackUp_Assets'),1,null,null)
partition_number列:当前索引所在分区号,同sys.dm_db_index_physical_stats定义中的partition_number参数
index_type_desc列:索引类型-聚集索引或者非聚集索引等。
alloc_unit_type_desc列:分配单元类型--这个在下面解释
avg_fragmentation_in_percent列:最重要的列,当前索引碎片比率。
分配单元类型讲解:
IN_ROW_DATA:包含除大型对象 (LOB) 数据以外的所有数据的数据行或索引行。页的类型为 Data 或 Index。
LOB_DATA:以下列一种或多种数据类型存储的大型对象数据:text、ntext、image、xml、varchar(max)、nvarchar(max)、varbinary(max) 或 CLR 用户定义类型 (CLR UDT)。页的类型为 Text/Image。
ROW_OVERFLOW_DATA:存储在超过 8,060 字节行大小限制的 varchar、nvarchar、varbinary 或 sql_variant 列中的可变长度数据。页的类型为 Data。
注意:有时候,我们只为表创建了一个索引,但通过sys.dm_db_index_physical_stats却查出了两条记录,这就是因为在表中使用了text、ntext、image、varchar(max)、nvarchar(max)、varbinary(max)和xml列,也就是LOB_DATA存储单元.使用了这些列后,在创建表但未插入数据前只有一条记录,但有插入过数据后,就会有两条记录了,两条记的区别就是alloc_unit_type_desc中的值的区别,可能的情况就是一条的值是N_ROW_DATA,另一条的值是LOB_DATA。
读者可以自己做测试:
补充一点:sys.dm_db_index_physical_stats函数中五个参数都可以为null。
查询当前库的所有表的索引情况
查询所有数据库中所有索引情况,当然了,前提是你必须有查询其它数据库索引的权限,如果权限不够,会返回错误:
用户没有执行此操作的权限。
以上为本章的全部内容,讲述的比较零乱,希望大家见谅。
在本站后面的文章中会继续讲述如何利用SQL重新生成与重新组织索引,请关注!