SQL Server 2005的ROW_NUMBER()分页效率比较

2022-04-07 06:30:14

多年以后，还有很多程序员不知道SQL Server2005有了更方便的分页方法，这就是ROW_NUMBER()函数。我们知道SQL2000时代的分页方式是TOP加NOT IN截取中间数据，效率也是很不错的，但这两种效率到底如何呢，我们这次以一万、十万和百万数据量的数据做演示，比较这两种分页方式的效率。另外为何使用TOP+NOT IN来和ROW_NUMBER()比较，是因为和游标方式及ISNULL方式分页来说，TOP+NOT IN方式效率更高。前人已有证明，可参考这篇文章：http://www.cnblogs.com/morningwang/archive/2009/01/02/1367277.html ，或者自行搜索更权威文章。

准备工作

准备工具：电脑（当然了o(∩_∩)o ）和程序员一名。

同一测试环境，电脑配置如下，数据如有不实，请找周鸿祎~

建立数据表，插入相应数据。表结构如下，Id为自增长主键：

插入100万条测试数据：

user table3
go

declare @index int

set @index=0

while @index<1000000

    begin

        insert into Users(Name) values(‘walkingp‘)

        set @index=@index+1

    end

接下来先扫盲一下ROW_NUMBER()函数。

ROW_NUMBER()函数

ROW_NUMBER()函数是根据参数传递过来的order by子句的值，返回一个不断递增的整数值，也就是它会从1一直不断自增1，直到条件不再满足。例如表Users(Id,Name)，使用以下sql语句进行查询：

select id,name,row_number() over(order by Id desc) as rowNum from users where id<10

select id,name,row_number() over(order by Id) as rowNum from users where id<10

两条语句order by排序相反，执行结果如下：

孰优孰劣

以下两种情况，同样取500000到500100中间的数据。

1、使用ROW_NUMBER()函数。

SQL语句如下：

declare @time datetime

declare @ms int

set @time= getdate()

select Id,Name from (select row_number() over(order by Id) as rowNum,* from users) as t where rowNum between 500000 and 500100

set @ms=datediff(ms,@time,getdate())

print @ms--毫秒数

测试了几次，平均在250毫秒：

2、使用TOP加NOT IN方法。

SQL语句如下：

select top 100 * from users where Id not in

    (select top 500000 id from users order by id)

    order by id

平均在236毫秒：

好吧，一起执行看看结果：

或者你认为SQL存在缓存的问题，把两部分顺序对掉一下：

以上是百万数据量的对比，再看看1万条数据下的对比：

结论

通过以上对比可以我们可以得到这样的结论：在小数据量下（一般应该认为是10万以下，TOP+NOT IN分页方式效率要比ROW_NUMBER()高；在大数据量下（百万级）ROW_NUMBER()分页方式效率要更高一些。

SQL Server 2005的ROW_NUMBER()分页效率比较

码农公寓

准备工作

ROW_NUMBER()函数

孰优孰劣

结论

相关文章