在日常开放中,经常会遇到从数据库中随机获取一条或多条数据的情况,从网上搜集整理了几条不同的写法,并对其整理了测试和实验,比较性能。
语句一:
1.1 语句:
SELECT * FROM usertest ORDER BY RAND() LIMIT 1;
这可能是我们最常用的随机记录的获取方式了。但是这种方式是不推荐的。
MYSQL手册里面针对RAND()的提示大概意思就是,在 ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描,导致效率相当相当的低,效率不行,切忌使用。
1.3 测试结果:
在1~2W数据量较小时,该方法还勉强凑活,但是数据量提升后,速度会越来越慢,所以不推荐使用.
别问我为什么后面的没数据,因为我实在不想测了,太慢了。
语句二:
2.1 语句:
SELECT * FROM users AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(userId) FROM `users`)-(SELECT MIN(userId) FROM users))+(SELECT MIN(userId) FROM users)) AS userId) AS t2 WHERE t1.userId >= t2.userId ORDER BY t1.userId LIMIT 1
2.2 分析:
执行该sql语句,用时0.031s,效率非常好。当把”LIMIT 1“改为了”LIMIT 100“ 随机取一百条记录,用时0.048s。可是就在此时问题出现了,发现结果好像不是随机的。为了验证结果,又执行了N次,的确不是随机的。问题出现 在”ORDER BY t1.userId“这里,按userId排序了。随机取一条记录还是不错的选择,多条就不行了啊。
2.2 测试结果:
效率比较好。在随机获取一条数据时时不错的选择。
在随机获取多条数据时,效率有所下降,并且不具备随机性,不推荐获取多条记录时使用。
语句三:
3.1 语句:
SELECT FROM users WHERE userId >= ((SELECT MAX(userId) FROM users)-(SELECT MIN(userId) FROM users)) RAND() + (SELECT MIN(userId) FROM users) LIMIT 1
3.2 分析:
执行该sql语句,用时0.039s,效率也是非常好。接着把”LIMIT 1“改为了”LIMIT 10000“,用时0.063s。经过多次验证,得出的结果都是随机的。
3.3 测试结果:
效率非常好。
无论是在获取一条或多条记录时,效率变化不大,并且结果具有随机性。