正则表达式

最新推荐文章于 2024-05-20 10:35:51 发布

原创最新推荐文章于 2024-05-20 10:35:51 发布 · 177 阅读

0 ·

CC 4.0 BY-SA版权

正则表达式专栏收录该内容

1 篇文章

订阅专栏

本文介绍正则表达式的概念、目的及常见元字符，如、^、$、*、+、、d、D、f、、，解释了它们在文本匹配中的作用，提供了实例帮助理解。

正则表达式：用来检索、替换那些符合某个规则的文本。

这个之前可能也见过，用过，但都是参考别人的，并不是很确定到底是干什么用的。

它是对字符串（字符和元字符）操作的一种逻辑公式，用事先定义好的一些特定字符、及这些字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。它是一种文本模式，模式描述在搜索文本时要匹配的一个或多个字符串。

使用正则表达式的目的：

给定的字符串是否符合正则表达式的过滤逻辑；
通过正则表达式，从字符串中获取我们想要的特定部分。

下面看一下几个常用的元字符和对它们的一个简短的描述：

元字符	描述
\	将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。
^	匹配输入字行首。如果设置了RegExp对象的Multiline属性，^也匹配“\n”或“\r”之后的位置。
$	匹配输入行尾。如果设置了RegExp对象的Multiline属性，$也匹配“\n”或“\r”之前的位置。
*	匹配前面的子表达式任意次。例如，zo能匹配“z”，也能匹配“zo”以及“zoo”。等价于{0,}。
+	匹配前面的子表达式一次或多次(大于等于1次）。例如，“zo+”能匹配“zo”以及“zoo”，但不能匹配“z”。+等价于{1,}。
\b	匹配一个单词的边界，也就是指单词和空格间的位置（即正则表达式的“匹配”有两种概念，一种是匹配字符，一种是匹配位置，这里的\b就是匹配位置的）。例如，“er\b”可以匹配“never”中的“er”，但不能匹配“verb”中的“er”；“\b1_”可以匹配“1_23”中的“1_”，但不能匹配“21_3”中的“1_”。
\d	匹配一个数字字符。等价于[0-9]。grep 要加上-P，perl正则支持
\D	匹配一个非数字字符。等价于[^0-9]。grep要加上-P，perl正则支持
\f	匹配一个换页符。等价于\x0c和\cL。
\n	匹配一个换行符。等价于\x0a和\cJ。
\r	匹配一个回车符。等价于\x0d和\cM。

推出来的几个常用的：

[^,]	除了逗号之外的任何字符
[^,]*	0或者多个非逗号字符
([^,]*)	将这些非逗号字符标记为\1，这样可以在之后的替换模式表达式中引用它
([^,]*),	0或者多个非逗号字符后面跟着一个逗号，并且非逗号字符那部分要标记出来以备后用。

正则字符串 = "开始（[包含内容]{长度}）（[包含内容]{长度}）（[包含内容]{长度}）结束"

实例：

字符串；tel:086-0666-88810009999

正则写法："^tel:\d{1,3}-[0]\d{2,3}-\d{8,11}$"

以后用到需要对字符进行匹配操作的时候可以考虑用正则表达式，虽然刚开始用着可能不简单，但用过之后，它真的特别方便。