最近工作中,有需要新做数据的统计汇总工作,本来一开始打算用Python的pandas库去数据库里统计的,
后来想着能否用一条sql语句解决问题。发现count()函数内可以加条件计数,sql模板如下 :
SELECT
COUNT(1) AS '总数',
COUNT (xjzt = '1' OR NULL) AS '状态1',
COUNT (xjzt = '2' OR NULL) AS '状态2'
FROM
t_table
WHERE
sfsc = 0
GROUP BY
'字段1',
'字段2'
至于为什么条件里要加上 OR NULL,原因如下:
如count(release_year = '2006' or NULL) 这部分 为什么要加上or NULL 直接count(release_year='2006')有什么问题吗?不就是要找release_year = '2006'的数据吗,为什么要计算NULL的数据?
因为 当 release_year不是 2006时 ,release_year='2006' 结果false 不是 NULL,Count在 值是NULL是 不统计数, (count('任意内容')都会统计出所有记录数,因为count只有在遇见null时不计数,即count(null)==0,因此前者单引号内不管输入什么值都会统计出所有记录数)至于加上or NULL , 很像其他编程里的or运算符,第一个表达式是true就是不执行or后面的表达式,第一个表达式是false 执行or后面的表达式 。当release_year不为2006时release_year = '2006' or NULL 的结果是NULL,Count才不会统计上这条记录数
案例
统计要求:
最终 sql如下:
select 'xx大学' as `平台`,city_name,col_name,count(1) as '总人数', count(idcard_status="身份证有效" OR NULL) as '身份证合规', count(idcard_status="身份证无效" OR NULL) as '身份证不合规', count(xueshengzheng_satus="学生证有效" OR NULL) as '学生证合规', count(xueshengzheng_satus="学生证无效" OR NULL) '学生证不合规', count(xueshengzheng_satus="学生证有效"and idcard_status="身份证有效" OR NULL) as '双证合规', count(xueshengzheng_satus="学生证无效"and idcard_status="身份证无效" OR NULL) as '双证不合规' from idcard_list_bak_20210714 group by city_name,col_name
参考:
https://blog.csdn.net/JAVA_nihao/article/details/98972263
https://blog.csdn.net/qq_32719287/article/details/79513164