#items.pyimport scrapy
classImgprojectItem(scrapy.Item):#********** Begin **********#
img_urls=scrapy.Field()#保存图片链接
images=scrapy.Field()#保存图片名字 #********** End **********#
- `step2/ImgProject/ImgProject/pipelines.py`
#pipelines.pyimport os,requests
from ImgProject import settings
classImgprojectPipeline(object):defprocess_item(self, item, spider):#********** Begin **********#
dir_path='{}'.format(settings.IMAGES_STORE)#文件夹路径:从配置文件settings中导入定义好的路径ifnot os.path.exists(dir_path):
os.makedirs(dir_path)
name=item['images']
img_url=item['img_urls']
img_path=dir_path+'/'+name+'.jpg'#图片的最终存储路径
img=requests.get(img_url,headers=settings.DEFAULT_REQUEST_HEADERS)#对图片的url发出请求,准备下载withopen(img_path,'wb')as f:#使用wb方式保存图片
f.write(img.content)#********** End **********#