深入学习SQL的Limit语句

一、基本语法
SQL的limit语法的如以下形式
SELECT * FROM table  LIMIT [offset,] rows | rows OFFSET offset
当省略offset的时候,offset作为0处理,表示提取查询到的前rows条数据;
当offset>=0时候,表示提取查询到的从offset开始的rows条数据;此时如果rows<0表示提取查询到的从offset开始的所有数据
当offset<0的时候,表示提取查询到的除出后rows条数据的所有数据,即剔除last row-rows到last rows之间的-rows条数据
另外,如果rows大于实际查询的数据条数,则取rows为实际查询的数据条数。
 
二、实例
检索记录行 6-15
1
SELECT FROM table LIMIT 5,10;

  

为了检索从某一个偏移量到记录集的结束所有的记录行,可以指定rows参数为 -1: 
 
检索记录行 96-last
1
SELECT FROM table LIMIT 95,-1;

  

如果只给定 rows 参数,它表示前rows 条数据;换句话说,LIMIT n 等价于 LIMIT 0,n
 
检索前 5 个记录行
1
SELECT FROM table LIMIT 5;    

 

 

返回第6-15行数据
1
2
3
4
5
select from table LIMIT 5,10;
select from table LIMIT 5;
select from table LIMIT 0,5;

  

 
返回0到last row-rows的数据
1
2
3
select from class limit 10 , -1
select from class limit -1 OFFSET 10

  

假如现在class表中有100条数据,则返回的是0开始的90条数据,即0到(100-10)
三、性能
1、offset比较小的时候
select * from yanxue8_visit limit 10,10
多次运行,时间保持在0.0004-0.0005之间
Select * From yanxue8_visit Where vid >=(
Select vid From yanxue8_visit Order By vid limit 10,1
) limit 10
多次运行,时间保持在0.0005-0.0006之间,主要是0.0006
结论:偏移offset较小的时候,直接使用limit较优。这个显然是子查询的原因。
 
2、offset大的时候
select * from yanxue8_visit limit 10000,10
多次运行,时间保持在0.0187左右
Select * From yanxue8_visit Where vid >=(
Select vid From yanxue8_visit Order By vid limit 10000,1
) limit 10
多次运行,时间保持在0.0061左右,只有前者的1/3。可以预计offset越大,后者越优。
 
性能优化:
 
方案1
Select * From cyclopedia Where ID>=(
Select Max(ID) From (
 Select ID From cyclopedia Order By ID limit 90001
) As tmp
) limit 100;
 
方案2
Select * From cyclopedia Where ID>=(
Select Max(ID) From (
 Select ID From cyclopedia Order By ID limit 90000,1
) As tmp
) limit 100;
 
同样是取90000条后100条记录,第1句快还是第2句快?
第1方案是先取了前90001条记录,取其中最大一个ID值作为起始标识,然后利用它可以快速定位下100条记录
第2方案择是仅仅取90000条记录后1条,然后取ID值作起始标识定位下100条记录
第1方案执行结果.100 rows in set (0.23) sec
第2方案执行结果.100 rows in set (0.19) sec
很明显第2方案胜出.因为这里ID是主键,所以不会去做全表扫描,而是直接返回limit offset+length条记录,这样看来limit比起MS-SQL的Top性能还是要提高不少的.
其实第2个方案完全可以简化成
Select * From cyclopedia Where ID>=(
Select ID From cyclopedia limit 90000,1
)limit 100;
直接利用第90000条记录的ID,不用经过Max运算,这样做理论上效率因该高一些,但在实际使用中几乎看不到效果,因为本身定位ID返回的就是1条记录,Max几乎不用运作就能得到结果,但这样写更清淅明朗,省去了画蛇那一足.
  可是,既然MySQL有limit可以直接控制取出记录的位置,为什么不干脆用Select * From cyclopedia limit 90000,1呢?岂不更简洁?
这 样想就错了,试了就知道,结果是:1 row in set (8.88) sec,怎么样,够吓人的吧。Select * 最好不要随便用,要本着用什么,选什么的原则, Select的字段越多,字段数据量越大,速度就越慢. 另外,第2方案中,ID是主键,所以不会去做全表扫描,而是直接返回limit offset+length条记录。
 
第1种方案同样可用于MS-SQL,而且可能是最好的.因为靠主键ID来定位起始段总是最快的.
Select Top 100 * From cyclopedia Where ID>=(
Select Top 90001 Max(ID) From (
 Select ID From cyclopedia Order By ID
) As tmp
)
但不管是实现方式是存贮过程还是直接代码中,瓶颈始终在于MS-SQL的TOP总是要返回前N个记录,这种情况在数据量不大时感受不深,但如果成百上千万,效率肯定会低下的.相比之下MySQL的limit就有优势的多,执行:
Select ID From cyclopedia limit 90000
Select ID From cyclopedia limit 90000,1
的结果分别是:
90000 rows in set (0.36) sec
1 row in set (0.06) sec
而MS-SQL只能用Select Top 90000 ID From cyclopedia 执行时间是390ms,执行同样的操作时间也不及MySQL的360ms。
 

本文转自邴越博客园博客,原文链接:http://www.cnblogs.com/binyue/p/3968245.html,如需转载请自行联系原作者
上一篇:云原生落地大爆发,企业和开发者如何把握先机?


下一篇:初识 sqlite 与 content provider 学习笔记