Python：Scrapy中重写ImagePipeline组件的file_path函数，自定义图片的路径和名称

最新推荐文章于 2025-06-05 22:19:03 发布

转载最新推荐文章于 2025-06-05 22:19:03 发布 · 3.9k 阅读

scrapy 专栏收录该内容

5 篇文章

订阅专栏

本文介绍如何在使用ImagePipeline组件下载图片时，将图片保存为原始文件名，而非默认的SHA1值。通过重写file_path函数可以实现这一目标。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

默认情况下，使用 ImagePipeline 组件下载图片的时候，图片名称是以图片URL的SHA1值进行保存的。
如：
图片URL: http://www.example.com/image.jpg
SHA1结果： 3afec3b4765f8f0a07b78f98c07b83f013567a0a
则图片名称： 3afec3b4765f8f0a07b78f98c07b83f013567a0a.jpg
但是，我想要以原来的图片名称进行保存，比如上面例子中的图片保存到本地的话，图片名称就应该是： image.jpg
stackoverflow 上说是可以重写file_path函数，def file_path(self, request, response=None, info=None):
就可以了，在file_path函数中return图片名称就可以了