
Python
Handsome_Engineer
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用Python抓取和解析网页(一)
<br />对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。最后,我们会原创 2011-03-22 21:16:00 · 1322 阅读 · 0 评论 -
利用Python抓取和解析网页(二)
WebjxCom提示: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。<br /> 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,转载 2011-03-22 23:14:00 · 1584 阅读 · 0 评论 -
利用Python抓取和解析网页(一)
WebjxCom提示: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档<br /> <br /> 上述代码的执行结果如下所示:<br /> 用Google搜索python时地址栏中URL的解析结果 ('http', 'www.google.com', '/search', '',<br /><br />'hl=en&q=p转载 2011-03-22 23:09:00 · 1518 阅读 · 0 评论 -
python抓链脚本程序
<br />从百度贴吧抓取前若干页所有帖子的脚本<br />import re, string, urllib f = open("百度贴吧.html", "w+") def baidutieba(url,PostBegin,PostEnd): for i in range(PostBegin, PostEnd ,50): m = re.findall(r"f?kz=/d.+?<//a>",urllib.urlopen(url+str(i)).read(),re原创 2011-04-11 17:30:00 · 984 阅读 · 0 评论