Python学习Scrapy图片保存一，最简单

最新推荐文章于 2025-06-05 21:00:14 发布

原创最新推荐文章于 2025-06-05 21:00:14 发布 · 2.4k 阅读

12 ·

CC 4.0 BY-SA版权

Scrapy 专栏收录该内容

13 篇文章

订阅专栏

本文介绍了一个使用Scrapy框架进行图片爬取的例子。通过定义RosiItem类存储图片链接，并设置IMAGES_STORE路径来指定图片保存位置。利用XPath解析网页获取图片URL，自动下载到指定文件夹。展示了从网页中抓取图片并保存的完整流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

items里面图片的链接一定要保存在images_urls，他会自动把图片下载到制定文件夹

import scrapy
class RosiItem(scrapy.Item):
    image_urls = scrapy.Field()

spider里面将链接赋值给 item[‘image_urls’]

item = RosiItem()
	pic_urls = response.xpath('//div[@class="contenta"]/img/@src').extract()
	item['image_urls'] = pic_urls

settings

#保存地址，可以自己定义
IMAGES_STORE = 'E:\PICTRRE'
#打开ImagesPipeline
ITEM_PIPELINES = {
  'scrapy.pipelines.images.ImagesPipelines':1

}

启动爬虫，图片会保存在，E:\PICTRRE下的一个full文件夹内

文件夹、文件名自己定义案例在这里

爬取网站分类下所有14000张图片，文件夹自定义、文件名根据爬取的标题、图片链接自定义案例在这里

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冥想10分钟大师

关注关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python进阶-04-Python Scrapy带你掌握Python Scrapy（2.12）爬虫框架，附带实战

Lookontime的博客

11-27

874

在Python进阶系列我们来介绍Scrapy框架最新版本2.12，远超市面上的老版本，Scrapy框架在爬虫行业内鼎鼎大名，在学习之前我想请大家思考Scrapy究竟能解决什么问题？或者能爬哪一类型的网站！还有针对Scrapy的局限性我们如何依然使用好Scrapy！好，开始我们今天的日拱一卒！

[Python]使用Scrapy爬虫框架简单爬取图片并保存本地

最新发布

2501_91304639的博客

06-05

193

python爬虫之scrapy使用ImagePipeline保存图片

scrapy抓取图片

reg183的专栏

05-17

500

spider.py 1.导入用于保存文件下载信息的item类. 2.在爬虫类中解析文件url，并保存在列表中，根据需要提取标题等其它信息 3.返回赋值后的item类 import scrapy from ..items import FileItem class MySpider(Spider): def parse(self,response): file_names = response.xpath('xxxxxxxx') #list，获取文件名称列表 .

scanpy如何保存图像

siyuanssssss的博客

05-06

1209

重要的是show=False是关键，写了这个才能直接用plt.savefig()

python使用 Scrapy 爬取唯美女生网站的图片资源

04-17

在本教程中，我们将探讨如何利用Scrapy来爬取"唯美女生"网站上的美女图片资源，并将这些图片保存到本地。首先，你需要确保已经安装了Python环境和Scrapy框架。如果还没有安装，可以使用以下命令进行安装： ```...

python 基于Scrapy框架抓取图片

01-17

为了使图片保存过程自动化，我们需要配置Item Pipeline。在`myproject/settings.py`中，启用`ImagesPipeline`： ```python ITEM_PIPELINES = { 'scrapy.pipelines.images.ImagesPipeline': 1 } ``` 同时，设置图片...

Python Scrapy图片爬取原理及代码实例

09-16

在Scrapy的设置文件（通常是`settings.py`）中，增加`IMAGES_STORE = './imgsLib'`，这告诉Scrapy图片应该保存在当前目录下的`imgsLib`文件夹里。最后，我们需要创建一个自定义的图片处理管道（Pipeline）。Scrapy...

用scrapy爬取下载某图片网站的全部图片

08-20

用scrapy爬取下载某图片网站的全部图片。代码中已经去除了具体网站的信息，代码只供学习用。

Scrapy 抓取图片

易水寒

04-09

619

1. 先写一个特殊的Itemclass 优快云ImgItem(scrapy.Item): image_urls = scrapy.Field() images = scrapy.Field()注意这个字段是写死的image_urls 是图片的地址的一个数组，images记录图片信息不用管。 2.yield item image_urls = response.css('#cnbl...

Scrapy之图片爬取。

lyx的专栏

06-23

4089

Scrapy有一个很好用的内置功能去获取图片。首先假设我们要自己写一个获取图片的爬虫吧。那么显然，你需要的就是获取图片链接，然后写一个专门下载图片的pipline。很开心的是，scrapy其实已经给你实现好了这个pipline了，是不是很贴心呢！好了，我们开始吧。和一般程序员同学爬取图片动不动就是美女不同，咱们今天爬汽车。 # coding=gbk from scrapy.spide

scrapy爬取图片

cuigelasi的博客

01-19

1167

一、安装scrapy 请按照安装教程安装scrapy。二、编写爬虫 2.1 创建项目[root@ cgls]# scrapy startproject beautiful_album_spider2.2 创建spider[root@ cgls]# scrapy genspider xiaohuar_spider xiaohuar.com2.3 写spider文件[root@ cgls]# vi

python中scrapy的使用之实战爬取网页并保存图片

Li_peipei的博客

08-11

1120

首先创建scrapy项目MyScrapy 新建jobbole.py文件 # -*- coding: utf-8 -*- import scrapy from scrapy import Request import re from MyScrapy.items import MyscrapyItem class JobboleSpider(scrapy.Spider): name ...

scrapy_“图片下载”

非为000的博客

07-04

440

1.通过命令 scrapy startproject netbian（‘netbian’是项目名称，随便取)， scrapy genspider xxx xxx,com 新建项目架构，生成项目结构如下，具体自行百度 2.在items.py文件自定义数据存储（注： “image_urls”, "images"均为图片管道默认保留字） # -*- coding: utf-8 -*- impo...

使用scrapy爬取图片

江玉郎

08-11

1万+

一半自定义方法这里我们以美食杰为例，爬取它的图片，作为演示，这里只爬取一页。美食杰网址 1 首先我们在命令行进入到我们要创建的目录，输入 scrapy startproject meishi, 接着根据提示cd meishi，再cd meishi, , 下来写 scrapy genspider mei meishij.net ,生成如图所示文件。（关于以上命令的讲解不在这次写的...

Python使用Scrapy爬虫框架全站爬取图片并保存本地的实现

下面是一个简单的示例代码，演示如何使用Scrapy爬虫框架爬取图片并保存本地：首先，创建一个新的Scrapy项目： ``` scrapy startproject CrawlMeiziTu ``` 然后，创建一个新的爬虫： ``` scrapy genspider ...