【学习笔记】正则表达式详解——《高性能JavaScript》

最新推荐文章于 2023-07-04 11:18:35 发布

原创

最新推荐文章于 2023-07-04 11:18:35 发布 · 285 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#正则表达式 #js

本文详细解析了正则表达式的运行效率和工作原理，包括编译、匹配过程、回溯机制以及如何避免回溯失控。通过实例解释了贪婪匹配与惰性匹配的区别，并提供了正则表达式优化的建议，如使用非捕获组、减少分支数量、具体化匹配模式等，以提升正则表达式的性能。

正则表达式的运行效率受很多因素影响：

1、匹配的目标文本千差万别，部分匹配&完全不匹配耗时要更长；

2、不同浏览器对正则引擎的优化程度不同。

工作原理：

Step1: 编译

将正则直接量或RegExp构造函数生成的对象转为原生代码程序。

Step2: 设置起始位置

确定目标字符串的起始搜索位置。此处有各种优化措施，例如^开始的则判断起始位置如果失败，则不作后续位置的搜索操作；匹配第三字符是x的字符串，则先找到x再回退两个字符等。

Step3: 匹配每个正则表达示字元

确定起始位置后，逐个检查文本，若匹配失败，则回溯到之前尝试匹配的位置上。

Step4: 匹配成功或者失败

发现一个完全匹配，成功；

所有的可能路径没有匹配到，返回Step2，从下一字符重新开始；

所有字符匹配失败，失败。

回溯是什么？

回溯是匹配过程的基础组成部分，同时也是影响整体性能的其中一环。

从左到右匹配时，遇到量词和分支需要进行决策。量词（*，+？或{2, }），决定何时尝试匹配很多字符；分支（ | ），要从可选项中选择一个尝试匹配。

这些可选项都会记录，当一条策略失败时，会回溯到最后一个决策点，以此往复。

分支与回溯

/h(ello|appy) hippo/.test('hello there, happy hippo'); // 要匹配‘hello hippo’和‘happy hippo’

首先找h，就在第一个；然后碰到分支，两个

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。