MySQL某列为 NULL 时该怎么处理数据?
当列中存在 NULL 值时,究竟会导致哪些问题?
1.count 数据丢失
当某列存在 NULL 值时,再使用 count 查询该列,就会出现数据“丢失”问题
SELECT count(*),count(Stock) from trade
当使用的是 count(name) 查询时,就丢失了值为 NULL 的数据丢失。
解决方案
如果某列存在 NULL 值时,就是用 count(*) 进行数据统计。
扩展知识:不要使用 count(常量)
阿里巴巴《Java开发手册》强制规定:不要使用 count(列名) 或 count(常量) 来替代 count(),count() 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。
说明:count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 值的行。
2.distinct 数据丢失
当使用 count(distinct col1, col2) 查询时,如果其中一列为 NULL,那么即使另一列有不同的值,那么查询的结果也会将数据丢失
select count(distinct TradeNo,Stock) from trade;
看出订单号一列的 5 条数据都是不同的,但查询的结果却为 4。
3.select 数据丢失
如果某列存在 NULL 值时,如果执行非等于查询(<>/!=)会导致为 NULL 值的结果丢失。
select * from trade
WHERE stock <> 1
无结果,但是数据库中存在
解决方案
要解决以上的问题,只需要在查询结果中拼加上为 NULL 值的结果即可
select * from trade
WHERE stock <> 1 or isnull(stock)
4.导致空指针异常
如果某列存在 NULL 值时,可能会导致 sum(column) 的返回结果为 NULL 而非 0,如果 sum 查询的结果为 NULL 就可以能会导致程序执行时空指针异常(NPE)
select sum(stock) from trade WHERE tradeID >= 1006
解决空指针异常
可以使用以下方式来避免空指针异常:
select ifnull(sum(STOCK), 0) from trade WHERE tradeID >= 1006
5.增加了查询难度
当某列值中有 NULL 值时,在进行 NULL 值或者非 NULL 值的查询难度就增加了。
所谓的查询难度增加指的是当进行 NULL 值查询时,必须使用 NULL 值匹配的查询方法,比如 IS NULL 或者 IS NOT NULL 又或者是 IFNULL(cloumn) 这样的表达式进行查询,而传统的 =、!=、<>… 等这些表达式就不能使用了,这就增加了查询的难度
select * from trade
WHERE stock is not NULL
select * from trade
where !ISNULL(stock)
推荐用法
阿里巴巴《Java开发手册》推荐我们使用 ISNULL(cloumn) 来判断 NULL 值,原因是在 SQL 语句中,如果在 null 前换行,影响可读性;而 ISNULL(column) 是一个整体,简洁易懂。从性能数据上分析 ISNULL(column) 执行效率也更快一些。