1. 异常现象
处理 Emoji 表情时,MySql 入库异常:Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x84&i...' for column 'message' at row 1
Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x84&i...' for column 'message' at row 1
2. 排查分析
这种情况下,可以先确认一下数据库该表设置的字符集,确认该异常字段也可以。一般是因为该字段的字符集配置的是 utf8 导致的。
因为需要入库的表情是4个字节,MySQL 的 UTF-8 只支持三个字节的存储,而一般字符是三个字节,所以没有问题。但是 emoji 表情是4个字节,这就存储不了了。
MySQL 为了解决这个问题,在5.5.3版本之后支持了存储4个字节的 utf8 字符集 utf8mb4,也就是说 utf8mb4 存取 utf8 的东西都是没有问题的,完全兼容。
3. 解决方案
为了避免重启线上数据库,这里只对异常字段进行字符集修复:
ALTER TABLE table_name MODIFY colum_name VARCHAR(2000) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci