性能调优11:查询统计

数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求(Query Request),查询优化器就会执行以下工作流程:编译请求,生成执行计划,并把执行计划缓存到内存中,执行计划,最后向客户端返回查询的结果。把执行计划存储到内存的目的是为了复用执行计划,减少编译查询请求的时间消耗和CPU消耗。当数据库引擎再次接收到相同的查询请求,数据库引擎不需直接跳过编译请求的过程,直接复用已经缓存的执行计划。

数据库引擎并不是把查询计划永久保存在内存中,而是会根据内存的压力,智能剔除一些创建时间早,并且复用频次少的执行计划。

一,语句句柄和计划句柄

数据库引擎要实现查询计划的复用,必须能够识别查询已经执行过,这就需要对查询语句进行标记;查询的执行计划也会被标记,这就需要用到两个唯一值:

  • sql_handle:用以唯一标识一段TSQL文本(Batch或SP),TSQL文本存储在SQL Manager Cache(SQLMGR)中;
  • plan_handle:用于唯一标识一个已编辑的查询计划,查询计划存储在计划缓存(Plan Cache)中;

一个sql_handle 能够生成多个查询计划,对应多个plan_handle,但是每个plan_handle只能对应一个sql_handle 。sql_handle对于每一个batch都是唯一的,但是,如果执行batch的条件发生改变,比如set 选项发生变化,那么数据库引擎在执行同样的batch时,会生成新的执行计划,产生新的plan_handle,但是sql_handle不变。想要了解更详细的信息,请阅读《2.0 Sql_Handle and Plan_Handle Explained》。

1,SQL句柄

sql_handle是一个token,可以认为是整个SQL Text的哈希值,用于唯一标记查询文本所属的batch或sp,把sql_handle传递给 sys.dm_exec_sql_text()动态管理函数,并结合偏移 statement_start_offset和statement_end_offset,可以抽取出单个查询的SQL文本。

函数 sys.dm_exec_sql_text(sql_handle, plan_handle)用于获得整个Batch的TSQL文本,由于TSQL文本都是以nvarchar(max)类型存储的,一个nvarchar是2个字节,因此,一般情况下,字节偏移量都是2的倍数,

2,计划句柄

plan_handle是一个token,可以认为是整个Execution Plan的哈希值,用于唯一标识一个batch或sp的查询执行计划,把plan_handle传递给sys.dm_exec_query_plan(plan_handle)动态管理函数,可以获取整体(batch或sp)的查询计划。

3,查询计划(query plan)

查询计划是指查询语句的显示计划(showplan),动态管理视图 sys.dm_exec_query_plan 返回以XML格式表示的showplan,动态管理视图 sys.dm_exec_text_query_plan 返回以文本格式表示的showplan:

sys.dm_exec_query_plan(plan_handle)

sys.dm_exec_text_query_plan   
(   
    plan_handle   
    , { statement_start_offset | 0 | DEFAULT }  
    , { statement_end_offset | -1 | DEFAULT }  
) 

文本方式可以指定batch中的单个TSQL语句,这需要指定该语句的偏移statement_start_offset 和 statement_end_offset。

二,抽取查询语句

动态管理视图 sys.dm_exec_query_stats 缓存的是单个查询语句的执行计划,而sql_handle指向的是整个Batch或SP的句柄值,因此,在该视图中,可能存在多个相同的sql_handle。

为了获得单个查询语句的文本,必须通过偏移量从整体(Batch语句)中抽取,偏移量的单位是字节,字节数量从0开始:

  • statement_start_offset:语句开始偏移的字节序号
  • statement_end_offset:语句结束偏移的字节序号,-1 表示TSQL文本的末尾

把sql_handle传递给 sys.dm_exec_sql_text()动态管理函数,并结合偏移 statement_start_offset和statement_end_offset,可以抽取出单个查询的SQL文本,抽取查询语句的脚本是:

select substring(st.text 
                ,qs.statement_start_offset/2+1,
                ( case when qs.statement_end_offset = -1 then len(convert(nvarchar(max), st.text))
                        else (qs.statement_end_offset - qs.statement_start_offset)/2
                    end 
                )
        ) as individual_query
        ,st.text as entire_query
from sys.dm_exec_query_stats qs
outer apply sys.dm_exec_sql_text(qs.sql_handle) as st

三,查询的统计数据

数据库引擎会把每一个查询请求的执行信息保存起来,例如,查询的文本,查询等待的时长,执行的时间,消耗的资源等,并对这些信息进行汇总和统计,这些汇总之后的数据就是查询统计,存储到内存结构 DMV:sys.dm_exec_query_stats中。在该视图中,每一行数据都表示一个查询语句的统计数据。

请求的执行信息都经过汇总之后,存储到DMVsys.dm_exec_query_stats中,从该统计数据中,可以找出对性能影响最大的查询请求,由于该DMV存储的是累加值,在使用数据之前,一定要关注记录的开始时间:

  • creation_time:计划编译的时间
  • last_execution_time:最近一次计划开始执行的时间

这两个时间表示查询计划的第一次执行和最后一次执行的时间戳。

1,查看语句级别的统计数据

执行计划的重编译次数,执行查询的总时间,逻辑读和物理读的次数等计数器,是观察查询执行情况的重要指标:

  • plan_generation_num:表示执行计划产生的数量,表示同一个TSQL文本重新编译的次数;
  • execution_count:计划执行的次数
  • total_elapsed_time:单词elapsed是指单个语句执行的总时间,包括 waiting的时间或 CPU工作(worker)的时间,单位是微秒(us),一微秒是千分之一毫秒(ms)
  • total_worker_time:CPU工作的总时间,单位是微秒(us)
  • total_logical_reads:查询计划执行的逻辑读的总次数;
  • total_logical_writes:查询计划执行的逻辑写的总次数;
  • total_physical_reads:查询计划执行的物理读的总次数;
  • total_rows:查询返回的数据行的总数量
  • total_dop:并发执行的并发度的累加和
  • total_grant_kb:该查询计划收到的预留授予内存(reserved memory grant)的总量,单位是KB
  • total_used_grant_kb:该查询计划使用的预留授予内存(reserved memory grant)的总量,单位是KB
  • total_ideal_grant_kb:该查询计划预估的理想授予内存(ideal memory grant)的总量,单位是KB
  • total_splils:查询计划执行时,出现页溢出的总页数;

以下脚本用于查看语句级别的执行计划的平均数据,并按照平均执行时间排序:

select top 111 
    qs.execution_count,
    qs.total_rows/qs.execution_count as avg_rows,
    qs.total_worker_time/qs.execution_count/1000 as avg_worker_ms,
    qs.total_elapsed_time/qs.execution_count/1000 as avg_elapsed_ms,
    qs.total_physical_reads/qs.execution_count as avg_physical_reads,
    qs.total_logical_reads/qs.execution_count as avg_logical_reads,
    qs.total_logical_writes/qs.execution_count as avg_logical_writes,
    qs.creation_time,
    qs.plan_generation_num,
    --st.text as entire_query,
    substring(st.text,
            qs.statement_start_offset/2 + 1,      
            ( case when qs.statement_end_offset = -1 
                        then len(convert(nvarchar(max), st.text))
                else (qs.statement_end_offset -qs.statement_start_offset)/2
              end)
            ) as individual_query
from sys.dm_exec_query_stats qs 
cross apply sys.dm_exec_sql_text(qs.sql_handle) as st 
order by avg_elapsed_ms desc

2,查看存储过程级别的查询统计

对于缓存的存储过程,数据库引擎把SP相关的统计数据缓存在视图:sys.dm_exec_procedure_stats 中,每一行数据都表示一个SP的统计数据:

select top 111
    db_name(ps.database_id) as db_name
    ,ps.database_id
    ,object_schema_name(ps.object_id,ps.database_id)+'.'+object_name(ps.object_id,ps.database_id) as proc_name
    ,ps.type_desc as proc_type
    ,ps.cached_time
    ,ps.execution_count
    ,ps.total_worker_time/ps.execution_count/1000 as avg_worker_ms
    ,ps.total_elapsed_time/ps.execution_count/1000 as avg_elapsed_ms
    ,ps.total_physical_reads/ps.execution_count as avg_physical_reads
    ,ps.total_logical_reads/ps.execution_count as avg_logical_reads
    ,ps.total_logical_writes/ps.execution_count as avg_logical_writes
from sys.dm_exec_procedure_stats ps
where ps.database_id<32767
order by avg_elapsed_ms desc

对于database_id 为 32767,这个id是资源数据库(Resource Database)预留的ID,一般情况下,用户创建的数据库ID都会小于该数值。

四,显示被缓存的计划

函数 sys.dm_exec_query_plan 以XML格式返回指定batch或SP的查询计划,参数是plan_handle,这意味着,函数返回的是整个语句(Batch或SP)的showplan,XML格式是可视化的,也可以返回文本格式的showplan。

select top 111 
    qs.execution_count,
    qs.total_rows/qs.execution_count as avg_rows,
    qs.total_worker_time/qs.execution_count/1000 as avg_worker_ms,
    qs.total_elapsed_time/qs.execution_count/1000 as avg_elapsed_ms,
    qs.total_physical_reads/qs.execution_count as avg_physical_reads,
    qs.total_logical_reads/qs.execution_count as avg_logical_reads,
    qs.total_logical_writes/qs.execution_count as avg_logical_writes,
    qs.creation_time,
    qs.plan_generation_num,
    st.text as entire_query,
    substring(st.text,
            qs.statement_start_offset/2 + 1,      
            ( case when qs.statement_end_offset = -1 
                        then len(convert(nvarchar(max), st.text))
                else (qs.statement_end_offset -qs.statement_start_offset)/2
              end)
            ) as individual_query,
    qp.query_plan
from sys.dm_exec_query_stats qs 
cross apply sys.dm_exec_sql_text(qs.sql_handle) as st 
outer apply sys.dm_exec_query_plan(qs.plan_handle) as qp
order by avg_elapsed_ms desc

五,计划的统计信息

动态管理视图:sys.dm_exec_cached_plans 中,每一个行存储一个查询计划,通过该视图,可以查看已缓存的查询计划、查询文本、缓存计划占用的内存、缓存计划复用的次数等信息。

select cp.refcounts
    ,cp.usecounts
    ,cp.size_in_bytes
    ,cp.cacheobjtype
    ,cp.objtype
    ,st.text as batch_sql
    --,cp.plan_handle
from sys.dm_exec_cached_plans cp
outer apply sys.dm_exec_sql_text(cp.plan_handle) st

 

参考文档:

Execution Related Dynamic Management Views and Functions (Transact-SQL)

上一篇:power-plan如何定


下一篇:Working Plan