# -*- coding: utf-8 -*-
import re
import urllib
import urllib2
class Spider:
def downLoad(self, url):
html = self.getHtml(url)
self.getImages(html)
#根据url 得到 html
def getHtml(self, url):
page = urllib.urlopen(url)
return page.read()
def getImages(self, html):
rgx = re.compile(r'src="(.+?\.jpg)" pic_ext')
imgList = rgx.findall(html) #根据 html 匹配出 图片的url
x = 0
for cur in imgList:
print ("下载第 %d 张" % x)
urllib.urlretrieve(cur, "%s.jpg" %x)
x = x + 1
if __name__ == "__main__":
url = "http://tieba.baidu.com/p/2460150866"
spider = Spider()
spider.downLoad(url)最基础的python抓取网站图片例子
最新推荐文章于 2025-10-14 11:39:52 发布
本文介绍了一个简单的Python爬虫程序,该程序可以抓取指定百度贴吧页面中的所有图片,并将其下载到本地。通过正则表达式匹配图片链接并使用urllib进行下载。
1004

被折叠的 条评论
为什么被折叠?



