上一篇文章中简单地讲述用scrapy进行简单爬虫流程
https://blog.youkuaiyun.com/reset2021/article/details/124449231?spm=1001.2014.3001.5502
这里在上篇文章的基础上讲述怎样用scrapy实现爬虫,并且保存到数据库中。
1、scrapy框架
scrapy框架如下图所示:
其中,包含两个中间件:下载器中间件(Downloader Middleware
)和爬虫中间件(Spider Middleware
)。使用中间件可以在爬虫的请求发起之前或者请求返回之后对数据进行定制化修改,从而开发出适应不同情况的爬虫。
1) downloader Middleware</