在开发中经常遇到要对表情字符处理,如果前端和后端都未做过滤就会碰到这样的异常 SQLException: Incorrect string value: '\xF0\x9F\x98\x84' for column 'xx' at row 1
,分析了原因并研究了下对服务端做处理的几种方式
原因
UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。
解决方案1
将Mysql的编码从utf8转换成utf8mb4。
- 修改my.ini [mysqld] character-set-server=utf8mb4
- 在Connector/J的连接参数中,不要加characterEncoding参数。 不加这个参数时,默认值就时autodetect。
- 将已经建好的表也转换成utf8mb4
命令:ALTER TABLETABLE_NAME
CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; (将TABLE_NAME替换成你的表名) 将需要使用emoji的字段设置类型为:
命令:ALTER TABLETABLE_NAME
MODIFY COLUMNCOLUMN_NAME
text CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;- 这种方法需要的硬性要求就是你的mysql数据库版本5.5以后的。一般有数据库管理工具的,直接打开改了就是了,比如我用的HeidiSQL,直接把表改为utf8mb4就可以了。这种方法简单省事,但是可能需要重启数据库。还有个问题是,有时候这方法不太灵。
解决方案2
利用工具进行字符转义