关于SQL Server Profiler的使用,网上已经有很多教程,比如这一篇文章:SQL Server Profiler:使用方法和指标说明。微软官方文档:https://msdn.microsoft.com/zh-cn/library/ms179428(v=sql.105).aspx有更详细的介绍。
经过使用Profiler进行监视,得到监视结果。
==================================以下是和文章标题无关的内容,举例说明优化语句=========================================
一个查询耗时非常大的语句
select t.表地址,t.当前热量,t.热功率,t.瞬时流量,t.累计流量,t.供水温度,t.回水温度,t.温差,t.累计工作时间,t.采集时间,t.社区编号,t.楼房编号,t.房间号
from measure_heat t
where 采集时间 = (select max(采集时间) from measure_heat where 表地址 = t.表地址 and 采集时间 >= '2013-11-11' and 采集时间 <= '2014-4-11')
这是一个用max函数查询大范围数据的语句。经过查询计划发现,采集时间列没有索引,导致查询时会有扫描表的操作。后来给采集时间列加上索引,再采用不同的查询语句进行分析。以下是分析结果
--如果查询很大范围的数据库,发现使用max函数是效率最高的,其他的排序函数效率一般。
--因为采集时间是有序的
------------------------使用max函数--------------------------
SET STATISTICS IO ON
DBCC DROPCLEANBUFFERS --关闭缓存
DBCC FREEPROCCACHE --关闭缓存
SELECT t.表地址, t.当前热量, t.热功率, t.瞬时流量, t.累计流量,
t.供水温度, t.回水温度, t.温差, t.累计工作时间, t.采集时间,
t.社区编号,t.楼房编号,t.房间号
FROM Measure_heat t
WHERE 采集时间 =
(
---很多时间花在这个地方,也就是如何能获得一个表的最近的采集时间。
select max(采集时间)
from measure_heat
where 表地址 = t.表地址
and 采集时间 >= '2013-11-11'
and 采集时间 <= '2014-1-11'
) ---------------------使用ROW_NUMBER函数-----------------------
--create nonclustered index testMeasure_heat on Measure_heat (采集时间, 表地址)
SET STATISTICS IO ON
DBCC DROPCLEANBUFFERS --关闭缓存
DBCC FREEPROCCACHE --关闭缓存
--如果存在,删除缓存表
--IF exists(SELECT * FROM #TableID) --存入数据库内存表
SELECT * INTO #TableID FROM
(
SELECT ROW_NUMBER() OVER (PARTITION BY 房间号 ORDER BY 采集时间 DESC) as rowID, id
FROM Measure_heat
WHERE 采集时间>='2013-11-1 0:00:00'
AND 采集时间<='2014-1-11 0:00:00'
--AND 房间号 = 119
) T
WHERE T.rowID = 1
SELECT * FROM #TableID
SELECT t.表地址, t.当前热量, t.热功率, t.瞬时流量, t.累计流量,
t.供水温度, t.回水温度, t.温差, t.累计工作时间, t.采集时间,
t.社区编号,t.楼房编号,t.房间号
FROM Measure_heat T RIGHT JOIN #TableID b ON t.id = b.id
ORDER BY t.id
DROP table #TableID ------------------------使用rank函数----------------------
DBCC DROPCLEANBUFFERS --关闭缓存
DBCC FREEPROCCACHE --关闭缓存
select * into #table2 from
(
SELECT 表地址, RANK() OVER (PARTITION BY 表地址 ORDER BY 采集时间) AS RankTest
FROM Measure_heat
WHERE 采集时间>='2013-11-1 0:00:00' AND 采集时间<='2014-1-11 0:00:00'
) t
where ranktest = 1
--SELECT * FROM #table2
SELECT t.表地址, t.当前热量, t.热功率, t.瞬时流量, t.累计流量,
t.供水温度, t.回水温度, t.温差, t.累计工作时间, t.采集时间,
t.社区编号,t.楼房编号,t.房间号
FROM Measure_heat T RIGHT JOIN #table2 a on a.表地址 = t.表地址
AND T.采集时间 BETWEEN '2013-11-1 0:00:00' AND '2014-1-11 0:00:00'
drop table #table2
另一个使用Min函数的语句,性能也非常差
select t.*
from Measure_heat t
where 社区编号='' and 采集时间 =(select min(采集时间 ) from Measure_heat where 房间号 = t.房间号 AND 采集时间>='2013-11-6 0:00:00' AND 采集时间<'2013-11-7 0:00:00' )
解决方法,在sql中建立内存表,先查出一部分,再利用第一部分的结果查询最终结果。最终可以秒查。
SET STATISTICS IO ON
DBCC DROPCLEANBUFFERS --关闭缓存
DBCC FREEPROCCACHE --关闭缓存
SELECT t.*
FROM Measure_heat t
WHERE 社区编号='' and 采集时间 =
(
SELECT min(采集时间 )
FROM Measure_heat
where
采集时间>='2013-11-6 0:00:00'
AND 采集时间<'2013-11-7 0:00:00'
AND 房间号 = t.房间号
)
ORDER BY t.id ------------使用内存表------------
SET STATISTICS IO ON
DBCC DROPCLEANBUFFERS --关闭缓存
DBCC FREEPROCCACHE --关闭缓存
--如果存在,删除缓存表
--IF exists(SELECT * FROM #TableID)
DROP table #TableID --存入数据库内存表
SELECT * INTO #TableID FROM
(
SELECT ROW_NUMBER() OVER (PARTITION BY 房间号 ORDER BY 采集时间 desc) as rowID, id
FROM Measure_heat
WHERE 采集时间>='2013-11-6 0:00:00'
AND 采集时间<'2013-11-7 0:00:00'
AND 社区编号=''
) T
WHERE T.rowID = 1
--SELECT * FROM #TableID
SELECT a.*
FROM Measure_heat a RIGHT JOIN #TableID b ON a.id = b.id
ORDER BY A.id 参考:
1. SqlServer性能检测和优化工具使用详细