mysql中utf8mb4和utf8的区别【转载】

最新推荐文章于 2025-04-01 11:19:00 发布

转载最新推荐文章于 2025-04-01 11:19:00 发布 · 332 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/woslx/article/details/49685111

文章标签：

#mysql #java #数据库

Mysql 专栏收录该内容

3 篇文章

订阅专栏

utf-8编码可能1个字节、2个字节、3个字节、4个字节的字符，但是MySQL的utf8编码只支持最多3字节的数据，也就是说mysql最开始的时候，对utf-8的支持是不完整的。而emoji表情字符是4个字节的字符。如果直接往采用utf-8编码的数据库中插入表情数据，java程序中将报SQL异常：

java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94’ for column ‘name’ at row 1
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1073)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3593)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3525)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1986)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2140)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2620)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1662)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1581)

可以对4字节的字符进行编码存储，然后取出来的时候，再进行解码。但是这样做会使得任何使用该字符的地方都要进行编码与解码。

为了支持完整的utf-8编码，mysql推出了utf8mb4，它是mysql平台上utf8编码的超集，兼容utf8，并且能存储4字节的表情字符。
采用utf8mb4编码的好处是：存储与获取数据的时候，不用再考虑表情字符的编码与解码问题。

————————————————
原文链接：https://blog.youkuaiyun.com/woslx/article/details/49685111