正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
目的:
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 判断给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”):
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
1.第一个常用的限定符是?,代表它前面的一个字符会出现0或1次
例如:
我们使用used?
就可以匹配到下面的use和used
use a used variable name is illegal
2.第二个常用字符代表匹配0个或者多个字符
例如我们输入ab*c
那我们就可以匹配下面的加粗部分
ac
abc
abbbbbbc
adc
addddc
3.第三个常用字符+代表匹配出现一次及以上的字符
输入ab+c
ac
abc
abbbbbbc
adc
addddc
4.第四个常用字符{}用于更精确的匹配
ab{6}c即为希望b出现6次
abbbbbbc
花括号允许字符出现范围ab{2,6}c
abbc
abbbbbbc
我们仅仅希望字符出现的次数为两次以上
ab{2,}c
5.如果想要匹配多个字符的重复
(ab)+
ac
abc
abbc
abababac
adc
addddddc
6正则表达式表达或a (cat|dog)
a cat
a dog
a bird