[HY000]; error code [1366]; Incorrect string value: '\xF0\x9F\x8C\x9D\xE1\xAD...' for column 'desc' at row 1; caused by: Incorrect string value: '\xF0\x9F\x8C\x9D\xE1\xAD...' for column 'desc' at row 1
马上意识到应该是字符编码不匹配的问题。经核实,是某个名字中含有表情,是个4个字节的utf8字符,utf8是可变长度的,根据字符的不同有1个字节、2个字节、3个字节和4个字节四种情况。
MySQL的utf8只支持3个字节的,4个字节的需要用utf8mb4。
mysql> show variables like 'char%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
以上,我把character_set_client和character_set_connection设置为utf8mb4就可以了。
character_set_client和character_set_connection其中一个不为utf8mb4,都会导致表情符号变成乱码,但是不会报错,只有都是uft8mb4,才能完整支持。
经过一系列的尝试,发现字符集的控制只与character_set_client和character_set_connection和这个字段的字符集类型有关系
与表、数据库、数据库服务器的字符集以及配置没有关系