正则表达式学习(一)认识正则表达式

最新推荐文章于 2025-10-20 00:16:10 发布

原创最新推荐文章于 2025-10-20 00:16:10 发布 · 519 阅读

CC 4.0 BY-SA版权

文章标签：

6 篇文章

订阅专栏

本文介绍了正则表达式的构成及基本使用方法，并通过实例详细解释了元字符的作用和量词的使用。

正则表达式一直是我的弱项，平时项目里用到很多时候都是去网上查。所以趁项目完结系统的又重新学习了下。

我们来看一个正则表达式：

#<div\s+[^>]*>(.*?)<\/div>#i

一个完整的正则表达式如上，有三部分组成：分隔符、表达式、修饰符

①分隔符

除了字母、数字、下划线、空白符以外的任何字符，比如/、#、~、%、@等。比较常用的就是/、#和~，但是为了避免与反斜线混淆，一般不用/。

②表达式

表达式就是我们所写的匹配规则，由一些特殊字符和非特殊字符组成的。表达式包括元字符、字符组、分支、环视等一些正则表达式的元素。

③修饰符

可以理解为某种模式，比如i表示忽略大小写模式，U表示懒惰模式，s表示跨行匹配模式等等。

测试工具

学习正则表达式可以使用一个叫Regex Tester的工具。网上搜一下就能找到。打开后是这样子的：

可以直接输入正则表达式，然后可以勾选相应的修饰规则，点Test，就可以得到匹配的结果。学习正则表达式用这个工具还是蛮方便的。

好了首先今天来一起学习下元字符，那什么是元字符呢？

元字符是正则表达式里具有特殊意义的专用字符，用来规定其前导字符在目标对象中的出现模式。比如\b表示英文单词的界定符，.表示任意一个除了换行符之外的字符。以下列出所有的元字符：