关于正则效率问题(正则导致程序卡死)

本文探讨了Java中正则表达式的使用风险,特别是在处理大量重复模式时可能导致的资源耗尽攻击。通过一个具体案例,分析了正则表达式在面对特定输入时的效率问题,并提出了一种更优的解决方案——利用程序循环而非正则循环来处理数组,显著提升了代码性能。
前言:

  在Java中,正则的使用需要谨慎,好的正则可以方便我们的代码,但是不好的正则,可能成为黑客攻击的漏洞。类似本例子的正则,黑客可以组织不同的匹配字符,使得校验不过,耗尽服务器资源(资源耗尽攻击)。详见正则的状态机原理。

1.说明:2018/8/17:
    校验输入字符串是否合规,允许:100000000000^145^1^1000.00| 100000000000^145^1^1000.00| ....
    如此序列(100000000000^145^1^1000.00|)必须满足1-18个,19个则失败。
    写正则:reg = ^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*\\|){1,18}$
代码:
String regex = "^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*\\|){1,18}$";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(prove);
if (!matcher.matches()) {
      return false;
}
return true;

2.问题:
    在测试案例中含有18个序列,正常通过。在案例增加到19个序列时,程序卡死。
3.分析:
    正则循环次数过多!导致资源耗尽或死循环。
4.解决方法:
    减少正则校验的循环次数,改为程序循环!,直接传递切割好的数组,再对数组进行循环。
代码:
String[] proves = accountProve.split("\\|");        
 if (proves.length > 18 || proves.length < 1) {
      return false;
  }
 for (String prove : proves) {
     String regex = "^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*)$";
     Pattern pattern = Pattern.compile(regex);
     Matcher matcher = pattern.matcher(prove);
     if (!matcher.matches()) {
         return false;
      }
 }
return true;
      

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TuringK

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值