30、高效正则表达式的构建与性能优化

高效正则表达式的构建与性能优化

非匹配情况下的工作

当正则表达式无法匹配时,会有大量额外的工作。以正则表达式 ".+"! 为例,它无法匹配示例文本 "The name \"McDonald’s\" is said \"makudonarudo\" in Japanese" ,但在匹配尝试过程中多次接近匹配,这导致了大量的回溯操作。

非匹配尝试

如图 6 - 4 所示,从 A 到 I 的匹配尝试失败后,会继续从其他位置(如 J、Q、V)重试,但最终在 Y 位置,所有可能的位置都尝试完,整体匹配失败。这个过程需要大量的工作来确定匹配失败。

更精确的匹配

将正则表达式中的点( . )替换为 [^"] 可以使匹配更精确,从而提高效率。例如,正则表达式 "[^"]+"! 中的 [^"]+ 无法越过闭合引号,减少了大量的匹配和回溯操作。

更精确匹配的失败尝试

如图 6 - 5 所示,与图 6 - 4 相比,需要的回溯操作明显减少。如果这种不同的匹配结果符合需求,减少回溯是一个很好的副作用。

交替匹配的代价

交替匹配是回溯的主要原因之一。以测试字符串 "The name \

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值