异常数据追踪
最近发现数据库中的一个字段值数据异常的问题,业务场景中不允许这个字符串字段中出现空格,但是发现有部分数据依然有'空格',反复验证过之后发现自己写的代码的的确确会把空格trim掉,反复调试后发现代码没有问题,但是什么情况使得这些数据逃过了业务代码的校验?
准备破案
难道我肉眼看到的'空格',不是我们平常见到或者理解的'空格'?
带着这个疑问,我搜索了一下相关的问题,发现果不其然,很多人都遇到了C2 A0这个不可见字符,那么这个字符到底是什么呢?
打开UTF-8的编码表,https://www.utf8-chartable.de/unicode-utf8-table.pl?utf8=dec 找到对应的字符
首先明确C2 A0代表的编码序号是多少,很显然我们只需要将这个十六进制转为十进制,即C2=194 A0=160,这个在编码表中对应的是
U+00A0 | 194 160 | NO-BREAK SPACE |
而我们一般意义上将的空格的编码是32
U+0020 | 32 | SPACE |
那们我们通过代码来模拟一下上面两个字符
普通的空格 Unicode code point为U+0020即32
C2 A0空格 Unicode code point为U+00A0即160
找到原因之后,我们想办法把这种C2 A0空格给去除掉
源代码见下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 |
|
如果对您有帮助,请不要忘了给翎野君点赞。