我们在和微信对接的时候获取用户的昵称的时候,出现出错的情况。如下:
Incorrect string value: '\xF0\x9F\xA5\xB6' for column 'nick_name' at row 1
错误的大体意思是nick_name字段是不正确的字符串值。
我们发现原来是因为数据库编码问题导致的,原因在于我们的昵称中存在emoj表情,而这些表情是按照四个字节一个单位进行编码的,而我们通常使用的utf-8编码在mysql数据库中默认是按照3个字节一个单位进行编码的,正是这个原因导致将数据存入mysql数据库的时候出现错误,那么这个问题我们应该怎么解决呢?
我分为下面三个步骤来解决:
(1):修改mysql数据库的编码为uft8mb4
(2):修改数据表的编码为utf8mb4
(3):修改连接数据库的连接代码
一:修改mysql数据库的编码为uft8mb4
1:先看下字段的编码格式
show character set;
utf8 UTF-8 Unicode utf8_general_ci 3
所以呢,这个需要4字节才能表示的Unicode字符会被截断,存不进去。
说明:看下你的数据库版本,如果是5.5.3是不支持四个字符的,如果想使用把字段类型改为 MEDIUMBLOB
2:MySQl>=5.5.3,则可以不用像上面那么做
修改mysql配置文件,设置默认字符集utf8mb4, 包括collation
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect=’SET NAMES utf8mb4’
3:重启,确认生效
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8mb4 |
| character_set_system | utf8 |
| collation_connection | utf8mb4_unicode_ci |
| collation_database | utf8mb4_unicode_ci |
| collation_server | utf8mb4_unicode_ci |
二:修改数据表的编码为utf8mb4
执行命令:ALTER TABLE TABLE_NAME CONVERT TO CHARACTER SET utf8mb4;
三:修改连接数据库的连接代码
我原先的数据库连接代码是:
spring.datasource.url=jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=utf-8&useSSL=false&serverTimezone=GMT%2B8
将其修改成:
spring.datasource.url=jdbc:mysql://localhost:3306/test
四:确定mysql-connector-java的包
如果是5.1以下是有问题,建议升级到8.1以上