Python的抓取图片保存到本地
import urllib.request #打开和读取url的模块
import re #python匹配的模块
import os #python与操作系统交互的模块(创建文件夹等)
def gethtml(url):
page = urllib.request.urlopen(url) #访问网页
html = page.read()#读取该网页的html代码,同时将其转换为utf-8编码
return html.decode('utf8')
def getImage(html):
reg = r'src="(.+?\.jpg)"'#正则表达式匹配
image = re.compile(reg)#编译正则表达式生成一个正则表达式对象
imageList = image.findall(html)#把网页中所有匹配的图片地址放到imageList里
path='D:\\image'
if not os.path.isdir(path): #如果这个目录不存在
os.makedirs(path)#则创建
paths = path + '\\'#将图片保存至这个目录下
x=0
for imageurl in imageList:
urllib.request.urlretrieve(imageurl,'{}{}.jpg'.format(paths,x))#打开imglist中保存的图片网址,并下载图片保存在本地,format格式化字符串
x = x + 1
return imageList
html = gethtml('http://tieba.baidu.com/p/2460150866')
print(getImage(html))