python 利用正则过滤表情符号

本文介绍了使用Python和正则表达式处理MySQL数据库中表情符号的方法,通过定义正则表达式并应用到数据中,实现表情符号的过滤,避免数据类型不匹配错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

mysql在插入数据库的时候,在有表情符号的情况下,经常会报数据类型不符的错误,

表情符号常常在于手机端一些用户名称和会话中出现,一般情况下把数据库utf8改成utf8mb4就没有问题了可以正常上传

但是不排除即便更改,也无法上传的情况,所以在此,分享下如何用python将表情符号过滤


import re

引入re模块,Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作



highpoints = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]')

在这里定义正则,highpoints为顶以后的正则


nickname = highpoints.sub(u'', testdata)

nickname就是最后得到的没有表情的数据,testdata是源数据,我们把源数据中的表情替换为空了


import re
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值