用python3从网页中爬取图片下载到本地

最新推荐文章于 2023-04-06 16:58:33 发布

take it down

最新推荐文章于 2023-04-06 16:58:33 发布

阅读量2.8k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Python

本文链接：https://blog.youkuaiyun.com/myydebk666/article/details/82803541

前提：使用的python是python3版本，2和3还是有很大的区别的。

1、先找一个有图片的网页（这里找到的是新浪：http://photo.sina.com.cn）。右键，选择最后一个检查，就可以看到网页的源代码。然后是图片的都是在标签（）中。
urllib.request是爬取网页时需要用到的一个库,re是正则匹配的一个库。
具体可以参考一下这篇文章：
https://blog.youkuaiyun.com/duxu24/article/details/77414298

import urllib.request,re

f=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
#先将截取的目标代码取下来
print(re.search(r'(<img src=\")(.*)(\")',source))

在这里插入图片描述
可以看到是这样的输出，但是我们的目的是只选取蓝色的部分
改进

import urllib.request,re

f=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
# print(source)
res = re.search(r'(<img src=\")(.*)(\")