()表示要提取的部分
|表示或的关系
| \w | 匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集。 |
| \s | 匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。 |
| \S | 匹配任何可见字符。等价于[^ \f\n\r\t\v]。 |
| * | 匹配前面的子表达式任意次。例如,zo*能匹配“z”,也能匹配“zo”以及“zoo”。 |
| + | 匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。 |
| ? | 匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“do”或“does”中的“do”。?等价于{0,1}。 |
using System.Text.RegularExpressions;
Match m;
string content = "AAAAA";
m = Regex.Match(content, @"<td class=.td_line.>\s*<a href='([^>]+?)'>([\S\s]+?)</a></td>");
while (m.Success)
{
url = m.Groups[1].ToString();
m = m.NextMatch();
}
3456

被折叠的 条评论
为什么被折叠?



