最近做了一个简单的工具,把那些动态的页面转换成HTML,类似于网络爬虫,只是少了里面的智能分析罢了。废话就少说了,之后的几篇文章 将对里面用到的知识 详细的说明一下。
程序主要的用到C#里面的 webclient ,webRequest ,网上普遍都是用这两个的,还有这里使用了异步编程(ARM),运行效率上好了很多,因为webClient使用比较简单,所以程序里以webClient为主,可是在测试的时候发现webClient有些缺陷,比如不能设置超时时间,而且有时会生成0kb的文件而不报错,所以遇到这样的情况使用了webRequest ,异步的方法有些复杂,希望能看得明白。
里面有4 个工程:
1、 AutoCreateHTML -- 设置配置文件, 还可以执行 指定任务,生成HTML
2、AutoCreateHTMLHost -- windows 服务,定时执行,自动 生成HTML
3、CreateHelp -- 实现层
4、DAL -- 数据层,简单起见用了dataset