这几天在做数据统计,有几个统计图的需求是这样的: 按照年、月、日统计订单数量, 比方一年12个月,统计出1月多少订单,二月多少订单,按照这种模式统计。
但是数据库里存放的是 timestamp 的 current_timestamp 默认值——"2016-12-16 12:30:00"。(这里许多公司会使用时间戳,其实都差不多)
当时脑子里想到的第一种做法是,讲所有数据一次性取出来,然后foreach 一个个date()后,得到日期后再一个个去分组。
后来考虑到如果数据量大了,性能上会不会出问题。就想到了mysql 内置的FROM_UNIXTIME() 函数 然后用一个group by 分组解决。
date("Y-m-d", 1481862600) = 2016-12-16 12:30:00
FROM_UNIXTIME(add_time, '%Y-%m-%d')
为了比较两个函数之间的效率,我做了一个实验,
1、创建一张表 只有三个字段
CREATE TABLE `t1` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`remark` char(10) DEFAULT NULL,
`add_time` int(11) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=458731 DEFAULT CHARSET=latin1;
2、再用自我复制语句,迅速将表数据复制到了20多万条数据
INSERT INTO t1(remark,add_time) SELECT remark,add_time FROM t1
3、接下来是PHP的执行代码
第一种,使用PHP的date函数循环赋值:
// 获取开始时间的微妙
$startTime = microtime(true);
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");
$rs = $pdo -> query("select id,add_time,remark from t1 limit 262144");
$data = $rs->fetchAll(); $php_number_count = 0;
foreach ($data as $item){
$php_number_count +=1;
$tmp[] = date("Y-m-d", $item['add_time']);
} echo $php_number_count."<br>";
echo "开始时间:".$startTime."<br>";
echo "结束时间:".$endTime = microtime(true). "<br>";
$resTime = $endTime - $startTime;
echo "用时:".$resTime;exit;
输出结果
开始时间:1481871208.7704
结束时间:1481871210.1535
用时:1.3830921649933 秒
第二种使用mysql的FROM_UNIXTIME()函数
// 获取开始时间的微妙
$startTime = microtime(true);
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");
$rs = $pdo -> query("select id,remark,add_time,FROM_UNIXTIME(add_time, '%Y-%m-%d') as datetime from t1 limit 262144");
$data = $rs->fetchAll(); echo "开始时间:".$startTime."<br>";
echo "结束时间:".$endTime = microtime(true). "<br>";
$resTime = $endTime - $startTime;
echo "用时:".$resTime;exit;
输出结果:
开始时间:1481871495.7308
结束时间:1481871496.7279
用时:0.99707913398743
从上面的结果显示明显是 使用 mysql的 FROM_UNIXTIME()函数要快一些
但是发现在使用PHP的date()函数里 多个一个对结果集的foreach 循环,为了保证数据的严谨性,我又再 使用 mysql的 FROM_UNIXTIME() 的后面加了一个结果集的foreach循环来尽量保证结果的准确性 如下
// ..........
$data = $rs->fetchAll();
foreach ($data as $row){
$tmp[] = $row['add_time'];
};
// .........
结果:
开始时间:1481871764.8102
结束时间:1481871766.0483
用时:1.2380890846252
为了尽量避免数据的偏差性、不稳定性,每份代码我分别执行了10次,并记录下结果
最后得出的结果是, 使用FROM_UNIXTIME()函数 是速度是最快的,如果group by 后能直接得到想要的结果集,那自然是最好的。
不过我们不能忽略mysql数据库执行的开销。毕竟执行中一定程度上会加大数据库的压力。
最后这个世界是没有最好的办法,只有最适合的办法。 如果哪位大侠有哪种更好的办法,欢迎分享。