项目中出现用QQ等第方登入时获取到第三方平台的昵称中出现表情无法插入到mysql数据库
经查特殊表情为utf8mb4格式,数据据也有这个编码但改成那个编码也没插入成功,因为项目中不用展示这些表情 ,所以没去管了,所以干脆用空字符串替换掉,代码如下,代码中用到的Range类引自guava包中的类
经查特殊表情为utf8mb4格式,数据据也有这个编码但改成那个编码也没插入成功,因为项目中不用展示这些表情 ,所以没去管了,所以干脆用空字符串替换掉,代码如下,代码中用到的Range类引自guava包中的类
static Range<Character> utf84ByteRange = Ranges.closed("\u1F601".charAt(0), "\u1F64F".charAt(0));
//把utf-8了字节编码的字符去掉
//参见: http://cenalulu.github.io/linux/character-encoding/
// 所谓Emoji就是一种在Unicode位于\u1F601-\u1F64F区段的字符
private static String replaceUtf84byte(String str) {
if (StringUtils.isBlank(str)) return StringUtils.EMPTY;
char[] chars = str.toCharArray();
for (int i = 0; i < chars.length; i++) {
if (Character.isSurrogate(chars[i])) { //参见: http://stackoverflow.com/questions/14981109/checking-utf-8-data-type-3-byte-or-4-byte-unicode
Logger.warn(chars[i] + "字符为 surrogate code unit, utf-8为4字节编码, 替换成空格");
chars[i] = ' '; //替换成空格
}else if (utf84ByteRange.contains(chars[i])) {
Logger.warn(chars[i] + "字符为 在\\u1F601-\\u1F64F, utf-8为4字节编码, 替换成空格");
chars[i] = ' '; //替换成空格
}
}
return new String(chars);
}
本文介绍了一种处理MySQL数据库中无法存储的UTF8MB4表情符号的方法。通过使用Guava库中的Range类,实现对特定范围内的表情符号进行过滤并替换为空字符串。
1802

被折叠的 条评论
为什么被折叠?



