正则表达式学习，及部分样例

最新推荐文章于 2025-12-22 21:14:24 发布

原创最新推荐文章于 2025-12-22 21:14:24 发布 · 462 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#正则表达式

本文介绍了正则表达式的概念，强调其实并不难学，主要难点在于组合后的可读性和理解。通过实例展示了正则在Java中的应用，如HTTPServlet和SpringMVC的URL配置，以及在数据解析和爬虫中的作用。同时，详细解释了正则的边界符、转义符、计量符和逻辑符等组成部分，并探讨了正则表达式引擎的工作机制。文章还提供了肯定和否定顺序、逆序环视的高级用法，帮助读者深入理解和应用正则表达式。

对于正则表达式，相信很多人都知道，但是很多人的第一感觉就是难学，

因为看第一眼时，觉得完全没有规律可寻，而且全是一堆各种各样的特殊

符号，完全不知所云。

其实只是对正则不了解而以，了解了你就会发现，原来就这样啊正则所用

的相关字符其实不多，

也不难记，更不难懂，唯一难的就是组合起来之后，可读性比较差，而且

不容易理解。

一、什么是正则表达式

正则表达式是一种特殊的字符串模式，用于匹配一组字符串，就好比用模具做产

品，而正则就是这个模具，定义一种规则去匹配符合规则的字符。

二、巧用正则解决实际问题

场景一：

编辑 word 文档，经常会查找字符串

三、正则表达式在 Java 中的应用

场景一：

HttpServlet 的 url 配置

场景二：

SpringMVC 的 url 配置等框架

场景三：

不规则数据的内容分析（爬虫、文档解析）

四、正则表达式其实并不是那么难

难懂的主要原因

1、可读性不强

2、一句话包含 N 种逻辑

正则表达式组成

1、边界符

2、转义符

3、计量符

4、逻辑符

五、正则表达式引擎的内部工作机制

总是从左往右一次匹配

六、常用的正则举例

匹配 html 标签 <[^>]+>

匹配中文字符[\u4E00-\u9FA5\uF900-\uFA2D]+

七、正则表达式的高级用法

肯定顺序常规： [a-z]+(?=;) 字母序列后面跟着;

肯定顺序变种： (?=[a-z]+$).+$ 字母序列

肯定逆序常规： (?<=:)[0-9]+ :后面的数字

肯定逆序变种： \b[0-9]\b(?<=[13579]) 0-9 中的奇数

否定顺序常规： [a-z]+\b(?!;) 不以;结尾的字母序列

否定顺序变种：(?!.*?[lo0])\b[a-z0-9]+\b 不包含 l/o/0 的字母数字系

列

否定逆序常规： (?<!age)=([0-9]+) 参数名不为 age 的数据

否定逆序变种： \b[a-z]+(?<!z)\b 不以 z 结尾的单词

一、肯定顺序环视常规用法

源字符串：

notexefile1.txt

exefile1.exe

exefile2.exe

exefile3.exe

notexefile2.php

notexefile3.sh

需求：获取.exe 后缀文件不含后缀的文件名

正则：.+(?=\.exe)

结果：

exefile1

exefile2

exefile3

二、否定顺序环视

源字符串：

notexefile1.txt

exefile1.exe

exefile2.exe

exefile3.exe

notexefile2.php

notexefile3.sh

需求：获取不是.exe 后缀文件不含后缀的文件名

正则：(.+)(?!\.exe)\.[^.]+$

结果：

notexefile1

notexefile2

三、肯定逆序环视

源字符串：

name=Zjmainstay

age=26

需求：获取 name 参数的值

正则：(?<=name=).+

示例很直白，前面必须是 name=，然后获取其后面的数据，由于环视不占位，因

此并没有出现在匹配结果中。

四、否逆序环视

源字符串：

name=Zjmainstay

age=26

需求：获取不是 name 参数的值

正则：^[^=]+=(?<!name=)(.+)

跟否定顺序示例一样，我们不能直接用(?<!name=).+进行匹配，正则做法是先把

参数部分匹配出来，再用否定逆序环视对它进行限定，限定它不能是 name=，因

此实现匹配。

实际应用 innerText

<div>a test</div>

(?<=<div>)[^<]+(?=</div>)

本文来源于咕泡笔记整理

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。