mysql utf8 emoji_mysql设置utf8编码导致无法存储emoji表情解决方案

这篇博客探讨了MySQL中utf8字符集的限制,指出它不支持四字节的UTF-8字符,如某些中文特性和Emoji。作者推荐使用utf8mb4代替,这是一个从5.5版本开始引入的扩展,能完全支持UTF-8编码。文中提供了一个Java工具类,用于在旧项目中转换字符串,将emoji表情转换为可正常显示的形式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

mysql中的”utf8“最大只支持3 个bytes,而真正的utf8编码(大家都使用的标准),最大支持4个bytes。正是由于mysql的utf8少一个byte,导致中文的一些特殊字符和emoji都无法正常的显示。mysql真正的utf8其实是utf8mb4,这是在5.5版本之后加入的。而目前的“utf8”其实是utf8mb3。mb就是 max bytes的意思(猜测)。所以尽量不要使用默认的utf8,使用utf8mb4才是正确的选择。

但是一些老项目默认数据库格式为utf8,可能就需要通过Java的方式进行转换,此处提供一个工具类进行编码转换

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class enCoderUtils {

/**

* 将str中的emoji表情转为byte数组

*

* @param str

* @return

*/

public static String resolveToByteFromEmoji(String str) {

Pattern pattern = Pattern

.compile("[^(\u2E80-\u9FFF\\w\\s`~!@#\\$%\\^&\\*\\(\\)_+-?()——=\\[\\]{}\\|;。,、《》”:;“!……’:'\"\\.?/\\\\*)]");

Matcher matcher = pattern.matcher(str);

StringBuffer sb2 = new StringBuffer();

while (matcher.find()) {

matcher.appendReplacement(sb2, resolveToByte(matcher.group(0)));

}

matcher.appendTail(sb2);

return sb2.toString();

}

/**

* 将str中的byte数组类型的emoji表情转为正常显示的emoji表情

*

* @param str

* @return

*/

public static String resolveToEmojiFromByte(String str) {

Pattern pattern2 = Pattern.compile("<:>");

Matcher matcher2 = pattern2.matcher(str);

StringBuffer sb3 = new StringBuffer();

while (matcher2.find()) {

matcher2.appendReplacement(sb3, resolveToEmoji(matcher2.group(0)));

}

matcher2.appendTail(sb3);

return sb3.toString();

}

private static String resolveToByte(String str) {

byte[] b = str.getBytes();

StringBuffer sb = new StringBuffer();

sb.append("<:>

for (int i = 0; i < b.length; i++) {

if (i < b.length - 1) {

sb.append(Byte.valueOf(b[i]).toString() + ",");

} else {

sb.append(Byte.valueOf(b[i]).toString());

}

}

sb.append(":>");

return sb.toString();

}

private static String resolveToEmoji(String str) {

str = str.replaceAll("<:>", "");

String[] s = str.split(",");

byte[] b = new byte[s.length];

for (int i = 0; i < s.length; i++) {

b[i] = Byte.valueOf(s[i]);

}

return new String(b);

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值