抓取网络图片下载到本地

最新推荐文章于 2020-12-15 17:23:42 发布

zhi2018

最新推荐文章于 2020-12-15 17:23:42 发布

阅读量347

点赞数

CC 4.0 BY-SA版权

分类专栏： python

本文链接：https://blog.youkuaiyun.com/rza1314/article/details/82670367

python 专栏收录该内容

7 篇文章

订阅专栏

该博客主要围绕抓取网络图片并下载到本地展开，虽未给出具体内容，但核心是实现网络图片的抓取与本地存储，涉及信息技术中数据采集和文件处理相关操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#coding:utf-8
import urllib.request
import re
import os

def open_url(url):
	#请求url
	req=urllib.request.Request(url)
	#设置请求头，简单地防止网站识别出爬虫
	req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36")
	#读取所有的html元素
	html=urllib.request.urlopen(req).read()
	return html
	
def get_links(url):
	html=open_url(url)
	#正则匹配img src="xxx"，尽可能少的匹配，懒匹配，匹配到第一个就停止
	r=re.compile('img src="(.*?)"')
	#从html元素里面找到 img src="xxx"
	result=r.findall(html.decode("utf-8"))
	#切换到d盘，这是保存图片的位置
	os.chdir("d:/")
	for img in result:
		#分离名字，[-1]是取最后一个
		filename=img.split("/")[-1]
		#保存图片
		with open(filename,"wb") as f:
			img=open_url(img)
			f.write(img)

if __name__=="__main__":
	#url="http://www.soupan.info/"
	url="http://jandan.net/ooxx/page-2017#comments"
	get_links(url)