前段时间遇到一个正则表达式的问题,发现自己已经忘记了很多正则表达式的写法,所以专门抽出时间进行了一下强化,顺便记录下来以备后面用到和记忆。
正则表达式
正则表达式不同语言用法都大同小异,主要就是一种匹配的输入文本的模式。我们可以使用正则表达式进行一些有规律的字符搜索、以及特殊格式字符串的判断。虽然说这些都可以使用字符串函数进行实现不过正则表达式相对来说更加灵活简洁。
一、C#中的正则表达式常用的类及引用命名空间
Regex类是一个定义匹配规则的类,主要用来产生正则表达式的规则对象。
用法:
Regex regex = new Regex(Regex Expression);
Match类是一个匹配结果,一般会保存一个匹配完成的结果。
用法
Match match;
MatchCollection可以说是Match的一个集合类。
用法
MarchCollection matchs;
序号 | 方法 & 描述 |
---|---|
1 | public bool IsMatch( string input ) 指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项。 |
2 | public bool IsMatch( string input, int startat ) 指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项,从字符串中指定的开始位置开始。 |
3 | public static bool IsMatch( string input, string pattern ) 指示指定的正则表达式是否在指定的输入字符串中找到匹配项。 |
4 | public MatchCollection Matches( string input ) 在指定的输入字符串中搜索正则表达式的所有匹配项。 |
5 | public string Replace( string input, string replacement ) 在指定的输入字符串中,把所有匹配正则表达式模式的所有匹配的字符串替换为指定的替换字符串。 |
6 | public string[] Split( string input ) 把输入字符串分割为子字符串数组,根据在 Regex 构造函数中指定的正则表达式模式定义的位置进行分割。 |
二、正则表达式字符转义
字符转义通过"\"表示一些特殊的转义字符,也可以按原意解释字符
转义字符 | 描述 | 模式 | 匹配 |
---|---|---|---|
\a | 与报警 (bell) 符 \u0007 匹配。 | \a | "Warning!" + '\u0007' 中的 "\u0007" |
\b | 在字符类中,与退格键 \u0008 匹配。 | [\b]{3,} | "\b\b\b\b" 中的 "\b\b\b\b" |
\t | 与制表符 \u0009 匹配。 | (\w+)\t | "Name\tAddr\t" 中的 "Name\t" 和 "Addr\t" |
\r | 与回车符 \u000D 匹配。(\r 与换行符 \n 不是等效的。) | \r\n(\w+) | "\r\nHello\nWorld." 中的 "\r\nHello" |
\v | 与垂直制表符 \u000B 匹配。 | [\v]{2,} | "\v\v\v" 中的 "\v\v\v" |
\f | 与换页符 \u000C 匹配。 | [\f]{2,} | "\f\f\f" 中的 "\f\f\f" |
\n | 与换行符 \u000A 匹配。 | \r\n(\w+) | "\r\nHello\nWorld." 中的 "\r\nHello" |
\e | 与转义符 \u001B 匹配。 | \e | "\x001B" 中的 "\x001B" |
\ nnn | 使用八进制表示形式指定一个字符(nnn 由二到三位数字组成)。 | \w\040\w | "a bc d" 中的 "a b" 和 "c d" |
\x nn | 使用十六进制表示形式指定字符(nn 恰好由两位数字组成)。 | \w\x |