【Java开发常见问题解决】文本框表情emoji字符过滤处理方法

本文探讨了在Java开发中遇到的emoji字符处理问题,由于UTF-8编码与Mysql的utf8不兼容导致数据插入异常。提出了三种解决方案:1) 将数据库和字段编码更改为utf8mb4;2) 利用emoji工具进行字符转义;3) 使用正则表达式过滤。详细介绍了每种方法的优缺点和实施步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在开发中经常遇到要对表情字符处理,如果前端和后端都未做过滤就会碰到这样的异常 SQLException: Incorrect string value: '\xF0\x9F\x98\x84' for column 'xx' at row 1
,分析了原因并研究了下对服务端做处理的几种方式

原因

UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。

解决方案1

将Mysql的编码从utf8转换成utf8mb4。

  1. 修改my.ini [mysqld] character-set-server=utf8mb4
  2. 在Connector/J的连接参数中,不要加characterEncoding参数。 不加这个参数时,默认值就时autodetect。
  3. 将已经建好的表也转换成utf8mb4
    命令:ALTER TABLE TABLE_NAME CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; (将TABLE_NAME替换成你的表名)
  4. 将需要使用emoji的字段设置类型为:
    命令:ALTER TABLE TABLE_NAMEMODIFY COLUMN COLUMN_NAME text CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

    • 这种方法需要的硬性要求就是你的mysql数据库版本5.5以后的。一般有数据库管理工具的,直接打开改了就是了,比如我用的HeidiSQL,直接把表改为utf8mb4就可以了。这种方法简单省事,但是可能需要重启数据库。还有个问题是,有时候这方法不太灵。

解决方案2

利用工具进行字符转义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值