过滤 “�”(任意0-7位数字)格式的字符串

本文介绍了一个用于过滤HTML中特定格式特殊字符的Java方法。该方法能够移除一系列范围内的HTML实体,包括中文字符和其他特殊符号,确保网页内容的纯净。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/**
* 过滤 “�”(任意0-7位数字)格式的特殊字符(过滤范围�-一 & 龥-�)(中文范围 一 - 龥)
* @param str
* @return
*/
public static String filter(String str) {
if (str == null || str.length() == 0) {
return str;
}
String regEx = "&#([1-9]\\d{0,3});|&#(1[0-9]\\d{3});|&#(19[0-9]\\d{2});|&#(199[0-6]\\d);|&#(1996[0-8]);";
//匹配范围 龥-�
String regEx2 = "|&#(409\\d{2});|&#(40[0-8]\\d{2});|&#(4[0-8]\\d{3});|&#([5-9]\\d{4});|&#(\\d{6});|&#(\\d{7});";
String regEx3 = regEx + regEx2;
// String str = "����顾客代理们��三月一日微信转账收费啦��";
Pattern pat = Pattern.compile(regEx3);
Matcher mat = pat.matcher(str);
boolean isMatcher = mat.find();
if (isMatcher){
try {
str = str.replaceAll(mat.group(0), "");
} catch (Exception e) {
// TODO: handle exception
}
}
while (mat.find()) {
str = str.replaceAll(mat.group(0), "");
}
return str;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值