#下载网页
import urllib.request
import re
def pageDown(url):
page=urllib.request.urlopen(url)
return page.read().decode("utf-8")
#解析网页,存储到文件
def parseAndSave():
str='src="(.*\.jpg)"'#正则表达式
reg=re.compile(str)
#解析出来的图片地址
imgList=re.findall(reg,page)
n=0
try:
for imgPath in imgList:
urllib.request.urlretrieve(imgPath,"z2/%s.jpg"%(n))
n+=1
except:
print("下载失败")
raise
#主函数调用
if __name__=="__main__":
page=pageDown("https://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&ie=utf-8&tab=album")
print(page)
parseAndSave()
python爬虫(解析图片)
最新推荐文章于 2024-07-17 12:33:51 发布
本文介绍了一个简单的Python爬虫程序,用于从指定的网页中下载并保存图片。程序首先使用urllib.request模块打开网页,读取网页内容,然后通过正则表达式解析出所有图片的URL,最后下载并保存这些图片。此教程适用于初学者理解网页抓取的基本流程。
23万+

被折叠的 条评论
为什么被折叠?



