在工作中,我们有时候需要从特定的网页中抓取我们想要的数据,由于工作的需要,我给大家推荐一个专门的抓取类:Winista.HtmlParser.dll
当我们需要从有规律的网页中提取数据时,如table tr td; ul li之类的,如果用正则表达式,或者做字符串的处理,会非常头痛。
上面的这个类可以解决此类问题。
首先,在工程文件的BIN目录里添加引用这个类,然后在页面中添加一些命名空间,
using Winista.Text.HtmlParser.Visitors;
using Winista.Text.HtmlParser;
using Winista.Text.HtmlParser.Util;
using Winista.Text.HtmlParser.Filters;
using Winista.Text.HtmlParser.Tags;
先上传一个类,包含了二个经常用到的方法
下面是具体的调用
有时间再把抓取table,ul的也整理一下,希望对大家有用,网上关于这方面的资料也有,但不是很全,主要还是靠自己摸索,