爬取图片地址,并保存到本地
1. 使用ImagesPipeline
(1) 在settings.py文件中的ITEM_PIPELINES中添加一条 'scrapy.pipelines.images.ImagesPipeline':1
(2) 在Item中添加两个字段
img_urls = scrapy_Field()
images = scrapy_Field()
(3) 在settings.py文件中添加保存路径IMAGES_STORE、图片url所在item字段IMAGES_URLS_FIELD
和文件结果所在item字段IMAGES_RESULT_FIELD
IMAGES_STORE = 'F:\\py_pic'
IMAGES_URLS_FIELD = 'img_urls'
IMAGES_RESULT_FIELD = 'images'
可以在settings.py中使用IMAGES_THUMBS制作缩略图,并设置缩略图的大小。
使用IMAGES_EXPIRES设置文件过期时间
IMAGES_THUMBS = {
'small' : (50,50),
'big' : (270,270),
}
IMAGES_EXPIRES = 30 #30天过期
2. 结果
命令:scrpay