正则表达式:用来检索、替换那些符合某个规则的文本。
这个之前可能也见过,用过,但都是参考别人的,并不是很确定到底是干什么用的。
它是对字符串(字符和元字符)操作的一种逻辑公式,用事先定义好的一些特定字符、及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。它是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。
使用正则表达式的目的:
- 给定的字符串是否符合正则表达式的过滤逻辑;
- 通过正则表达式,从字符串中获取我们想要的特定部分。
下面看一下几个常用的元字符和对它们的一个简短的描述:
| 元字符 | 描述 |
|
\ |
将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。 |
|
^ |
匹配输入字行首。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。 |
|
$ |
匹配输入行尾。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。 |
|
* |
匹配前面的子表达式任意次。例如,zo*能匹配“z”,也能匹配“zo”以及“zoo”。*等价于{0,}。 |
|
+ |
匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。 |
|
\b |
匹配一个单词的边界,也就是指单词和空格间的位置(即正则表达式的“匹配”有两种概念,一种是匹配字符,一种是匹配位置,这里的\b就是匹配位置的)。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”;“\b1_”可以匹配“1_23”中的“1_”,但不能匹配“21_3”中的“1_”。 |
|
\d |
匹配一个数字字符。等价于[0-9]。grep 要加上-P,perl正则支持 |
|
\D |
匹配一个非数字字符。等价于[^0-9]。grep要加上-P,perl正则支持 |
|
\f |
匹配一个换页符。等价于\x0c和\cL。 |
|
\n |
匹配一个换行符。等价于\x0a和\cJ。 |
|
\r |
匹配一个回车符。等价于\x0d和\cM。 |
推出来的几个常用的:
| [^,] | 除了逗号之外的任何字符 |
| [^,]* | 0或者多个非逗号字符 |
| ([^,]*) | 将这些非逗号字符标记为\1,这样可以在之后的替换模式表达式中引用它 |
| ([^,]*), | 0或者多个非逗号字符后面跟着一个逗号,并且非逗号字符那部分要标记出来以备后用。 |
正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"
实例:
字符串;tel:086-0666-88810009999
正则写法:"^tel:\d{1,3}-[0]\d{2,3}-\d{8,11}$"
以后用到需要对字符进行匹配操作的时候可以考虑用正则表达式,虽然刚开始用着可能不简单,但用过之后,它真的特别方便。
本文介绍正则表达式的概念、目的及常见元字符,如、^、$、*、+、、d、D、f、
、
,解释了它们在文本匹配中的作用,提供了实例帮助理解。
2618





