- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 python编写的简单爬虫程序
本文目的:从某个网站作为起点,爬虫获取到指定数目的图片、或者ftp资源;然后结束。 主要使用HTMLParser解析资源(开始使用SGMLParser,但是发现img标签不能解析出来,就换了这个)。 拷贝代码保存,python $文件名 就可以运行了。使用时主要需要修改的就是HOST/URI (爬虫开始的URL),NUM_ALL(指定获取资源的数目,到这个数目之后停止,运行
2013-11-25 17:54:05
826
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人