在C#中使用正则表达式自动匹配并获取所需要的数据（转）

最新推荐文章于 2022-02-24 21:38:29 发布

weixin_33974433

最新推荐文章于 2022-02-24 21:38:29 发布

阅读量117

点赞数

CC 4.0 BY-SA版权

文章标签： c# java javascript ViewUI

原文链接：http://www.cnblogs.com/Godblessyou/archive/2011/04/18/2019802.html

本文介绍如何在C#中利用正则表达式从HTML文本中精确匹配并提取所需数据，示例展示了从特定HTML结构中抓取指定信息的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正则表达式能根据设置匹配各种数据（比如：e-mail地址，电话号码，身份中号码等等）。正则表达式功能强大，使用灵活，C#，Java，JavaScript等多种语言都支持正则表达式。在互联网上“抓取数据”更是少不了使用正则表达式。今天我要说的是在C#中使用正则表达式自动匹配并获取所需要的数据。

从下面是某个IP查询网站返回查询结果的一个部分（字符串），现在就是要从这个字符串中获取“查询结果1：”后面的“北京市网通”。

< td align ="center" >< ul >< li > 查询结果1：北京市网通 </ li >< li > 查询结果2：北京市网通 </ li >< li > 查询结果3：北京市网通 </ li ></ ul ></ td >

C#相关代码如下：

string srcString = " <td align=\ " center\ " ><ul><li>查询结果1：北京市网通</li><li>查询结果2：北京市网通</li><li>查询结果3：北京市网通</li></ul></td> " ;
// 匹配 "<li>查询结果1：" 与 "</li>" 之间的所有字符的正则表达式
string regexStr = " <li>查询结果1：(?<key>.*?)</li> " ;
Regex r = new Regex(regexStr, RegexOptions.None);
Match mc = r.Match(srcString);
string dataStr = mc.Groups[ " key " ].Value;

说明：
这里最关键的是设置正则表达式： " <li>查询结果1：(?<key>.*?)</li> "。

字符

描述

<key>

根据key获取由正则表达式匹配的值。

匹配除 "\n" 之外的任何单个字符。

匹配前面的子表达式零次或多次。

跟在任何一个其他限制符(*, +, ?, {n}, {n,}, {n,m})后面时，匹配模式是非贪婪的;非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。

dataStr 就是我们要得的数据：“北京市网通”。

来自： http://www.cnblogs.com/anjou/archive/2007/03/20/681744.html

转载于:https://www.cnblogs.com/Godblessyou/archive/2011/04/18/2019802.html