2024年python爬虫入门：批量爬取网站图片并保存_python爬虫图片

最新推荐文章于 2025-10-23 09:00:05 发布

原创

最新推荐文章于 2025-10-23 09:00:05 发布 · 945 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫 #开发语言

page_text = response.text
tree = etree.HTML(page_text)

文本匹配

首先观察，发现所有的图片地址都在figure标签中，所有的figure标签又都存在于 div class=“gallery_inner” 中，所以我们先匹配到div这个标签。
在这里插入图片描述
在xpath中//表示在该本文中搜索所有的div标签，[@class=“gallery_inner”]则将div标签限定，再通过/figure找到所有的标签。

xpath进行匹配：

figure_list = tree.xpath('//div[@class="gallery_inner"]/figure')

接着我们对所有的li标签进行循环，依次对每个图片地址进行操作。

for figure in figure_list:
    img_src = figure.xpath('./a/img/@data-src')[0]
    img_src = 'https:' + img_src
    img_name = img_src.split('/')[-1]
    img_data = requests.get(url=img_src,headers=header).content
    img_path = 'piclitl/' + img_name
    with open(img_path, 'wb') as fp:
         fp.write(img_data)
         print(img_name, '下载成功')

大致框架搭好后运行，发现了两个报错：

一、在对figure标签请求时，匹配没有结果出现列表超

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

2401_84562425

关注关注

15
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pyhon爬虫之爬取图片(亲测可用)

我不是码农的博客~~~

08-04

4361

我们往下滑动就可以看到每一个请求都是pn值和PageNum值会变那我们只需要再爬取的时候吧这两个值变动一下就可以了我们可以看到每一个请求只有30个数据那么还需要进行处理一下。当看你看到响应里有确切的地址的时候先不要着急爬取先复制这个链接然后点击查看页面源代码（快捷键：ctr+=U）查找一下里面有没有这个地址。我们随便点开一个就可以看到里面有明确的图片的源地址我们可以复制打开一下。我们现在知道的图片的地址但是要抓取所以图片就需要进行二级页面的爬虫。......

python爬虫入门：批量爬取网站图片并保存_python爬虫图片

m0_60575487的博客

04-15

457

首先观察，发现所有的图片地址都在figure标签中，所有的figure标签又都存在于 div class=“gallery_inner” 中，所以我们先匹配到div这个标签。在xpath中//表示在该本文中搜索所有的div标签，[@class=“gallery_inner”]则将div标签限定，再通过/figure找到所有的标签。通过对网站的分析，我们发现图中创意视频推荐也在figure标签中，所以但其实际上没有a和img标签，所以匹配没有结果，导致程序直接报错停止。获取网页文本并将文本解析。

参与评论您还未登录，请先登录后发表或查看评论

python 抓取一个网站所有图片并保存

04-23

python 抓取一个网站所有图片并保存。 python 抓取一个网站所有图片并保存 python 爬虫

Python爬虫-如何将图片和视频保存到本地

最新发布

Datafox（数据狐199-7010-8018）

10-23

697

本文介绍了一个Python媒体下载器类MediaDownloader，用于从网页爬取并下载图片和视频。该类主要功能包括：1）通过BeautifulSoup解析网页提取图片和视频URL；2）使用requests库下载图片，支持懒加载图片处理；3）流式下载视频文件，支持断点续传；4）自动分类保存到images和videos文件夹。使用示例展示了如何初始化下载器并指定目标URL进行爬取下载。代码实现了完整的媒体资源下载流程，包含错误处理和文件组织功能，适合批量下载网页中的多媒体内容。使用时需遵守目标网站规则，注意

python爬虫入门：批量爬取网站图片并保存

m0_74942241的博客

02-06

7112

通过爬虫技术对图片进行批量爬取可以说是我们必备的爬虫技巧之一，网络爬虫也叫做网络机器人，可以代替人们自动地在互联网中进行数据信息的采集与整理。在大数据时代，信息的采集是一项重要的工作，如果单纯靠人力进行信息采集，不仅低效繁琐，搜集的成本也会提高。这里先对要运用的第三方库进行安装。本文选取的函数库主要为requests、lxml、etree。打开anaconda prompt，这是anaconda的交互界面，很多指令在该界面直接输入，便可直接下载众多函数库。

python爬取图片_python批量爬取网络图片

weixin_39862097的博客

11-23

663

上篇通过python爬取了一篇网络小说，初步了解了爬虫的四步流程，本文稍微扩展一点，试着从网页中爬取出多个图片，具体来看看：我们今天试着从下面图1的网页上将所有图片都爬取出来，放在一个指定的文件夹里。图1 目标网页还是按爬虫4流程：发出请求——获得网页——解析内容——保存内容1、发出请求1)找到网页地址：在网页上右键单击“审查元素”，弹窗里选中Network面板，从左侧name列表里逐个选择项目，...

python 爬取图片并保存函数_Python爬取网站图片并保存的实现示例

weixin_39846898的博客

03-01

1228

先看看结果吧，去bilibili上拿到的图片=-=第一步，导入模块import requestsfrom bs4 import BeautifulSouprequests用来请求html页面，BeautifulSoup用来解析html第二步，获取目标html页面hd = {'user-agent': 'chrome/10'} # 伪装自己是个(chrome)浏览器=-=def download_a...

python爬虫抓取图片-简单的python爬虫教程：批量爬取图片

weixin_37988176的博客

11-01

1923

python编程语言，可以说是新型语言，也是这两年来发展比较快的一种语言，而且不管是少儿还是成年人都可以学习这个新型编程语言，今天南京小码王python培训机构变为大家分享了一个python爬虫教程。网络爬虫，又被称为网页蜘蛛、网络机器人，爬虫分为通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、Deep Web爬虫这四种。“虫如其名”，爬虫并不是一种我们熟知的无脊椎动物中的节肢动物，而是一类计算器程序...

2401_84584609的博客

05-01

1361

PS：如有需要 Python学习资料以及解答的小伙伴可以加点击下方链接自行获取基本开发环境💨Python 3.6Pycharm相关模块的使用💨import csv安装Python并添加到环境变量，pip安装需要的相关模块即可。💥需求数据来源分析通过开发者工具, 抓包分析之后知道数据是从哪可以获取之后, 可以查看一下请求的url地址以及请求方式等💥代码实现import csv‘标题’,‘城市’,‘公司名字’,‘学历’,‘经验’,‘薪资’,‘公司福利’,‘详情页’,

Python爬虫入门教程31：爬取猫咪交易网站数据并作数据分析

2401_84009749的博客

04-21

1468

png)

2024年最全Python 批量爬取猫咪图片实现千图成像

2401_84584522的博客

05-01

167

”"获取缩略图的路径及平均色彩存储了图片路径、平均色彩值。“”"})‘’’计算两张图的颜色差，计算机的是色彩空间距离。dis = (R参数：color1，color2 是色彩数据（r，g，b）‘’’dis = 0return dis‘’’根据背景图，用头像填充出新图bgImg：背景图地址imgDir：头像目录N：背景图缩放的倍率M：头像的大小（MxM）‘’’

Python百度批量爬取图片

06-26

这个程序可以实现Python百度批量爬取图片，一次性最多爬取1020张图片，方便各位操作。注：如果出现侵权事件，本平台和作者不负任何责任。

python批量爬取网页图片（requests，xpath）

m0_51664504的博客

01-18

1971

闲来无事学习了python爬虫，xpath真是一个简单好用的工具，给我的LSP室友找一些符合他口味的图片。现在开始爬虫，所需工具：一台能上网并且可以运行python的电脑，python IDE（推荐pycharm或者anaconda），anaconda中集成了大量的python第三方库，对于我这种新手还是比较友好的），需要用到的第三方库：requests，lxml，os，time。

Python爬取网站图片并保存，超级简单

weixin_46174854的博客

01-31

6740

Python爬取网站图片并保存，超级简单第一步，导入模块 import requests from bs4 import BeautifulSoup requests用来请求html页面，BeautifulSoup用来解析html 第二步，获取目标html页面 hd = {'user-agent': 'chrome/10'} # 伪装自己是个(chrome)浏览器=-= def download_all_html(): try: url = 'https://www.bil

使用python批量爬取图片！！！！！！

m0_46503920的博客

03-29

1667

这是我第一次用python写一个脚本，也是第一次写出来一个有那么点用处的脚本(菜鸡欢迎大佬指正！同样欢迎同菜交流！！！) 也不知道有没有人看，但是如果有同样的萌新学会了请适量爬。说实话想爬虫肯定要学点html的，我稍微补了下html的知识，但是还是啥都不懂。每个图片每个页面都有自己的网址，而实现爬虫的原理就是获取网页信息，然后解析网页从中找到我们需要的信息，在这里我们需要的二级页面的网站，然...

Python批量爬取图片

weixin_44976611的博客

08-09

829

Python批量爬取美女图片

python批量爬取图片（超简单教程）

weixin_44960763的博客

02-02

2672

python爬取网页图片，小白，无基础，拿来就用，研究工具

python怎么批量爬取图片_Python制作批量爬取网络图片的方法

weixin_36130963的博客

02-20

3365

Python制作批量爬取网络图片的方法发布时间：2020-11-17 11:14:24来源：亿速云阅读：86作者：小新这篇文章给大家分享的是有关Python制作批量爬取网络图片的方法的内容。小编觉得挺实用的，因此分享给大家做个参考。一起跟随小编过来看看吧。Python爬虫爬图片需要什么？下面用两种方法制作批量爬取网络图片的方法：第一种方法：基于urllib实现要点如下：1.url_request ...

Python爬虫示例：如何爬取喜马拉雅音频并保存

资源摘要信息:"本文将详细介绍如何使用Python编程语言来爬取喜马拉雅FM上的音频文件，并将其保存到本地。这个示例特别适合编程初学者，即所谓的“小白”，因为它涉及到爬虫的基本概念和操作，但不会过于复杂。在阅读...