最简单的方式是使用 mysql 的 ORDER BY RAND() 子句。
SELECT col1 FROM tbl ORDER BY RAND() LIMIT 10; 它能很好的运行在小表中。然而,对于大表,生成随机列表行时将产生一个严重的性能问题,MYSQL 需要对每一行进行随机,然后对它们排序。 即使你只想从10W的结果集中取其中随机10行,MySQL也需要对这10W行进行排序并且只提取其中的10行。 为了解决这个问题,我在 WHERE 子句中使用 RAND 并且不使用ORDER BY 子句。首先,你需要计算表中的总行数和你想要的得到随机行数。其次,在 WHERE 子句中加入该碎片数字,并要求结果只能小于(或等于)从这个碎片数字。
例如,假设你有一个20万行的表,你只需要从表中随机100行。这个碎片数是从100/总行数得到:100 / 20万= 0.0005。
该查询将如下所示:SELECT col1 FROM tbl WHERE RAND() <= 0.0005;
为了得到准确的100行结果集,我们可以增加碎片数字和 limit限制:例如
SELECT col1 FROM tbl WHERE RAND()<=0.0006 limit 100;