
scrapy框架
weixin_43412054
为美好的明天努力
展开
-
Scrapy框架架构
Scrapy框架介绍:写一个爬虫,需要做很多的事情。比如:发送网络请求、数据解析、数据存储、反反爬虫机制(更换ip代理、设置请求头等)、异步请求等。这些工作如果每次都要自己从零开始写的话,比较浪费时间。因此Scrapy把一些基础的东西封装好了,在他上面写爬虫可以变的更加的高效(爬取效率和开发效率)。Scrapy架构图:流程图(1):流程图(2):Scrapy框架模块功能:Scrap...原创 2019-04-02 22:50:34 · 156 阅读 · 0 评论 -
Scrapy-Redis分布式爬虫组件
Scrapy是一个框架,他本身是不支持分布式的。如果我们想要做分布式的爬虫,就需要借助一个组件叫做Scrapy-Redis,这个组件正是利用了Redis可以分布式的功能,集成到Scrapy框架中,使得爬虫可以进行分布式。可以充分的利用资源(多个ip、更多带宽、同步爬取)来提高爬虫的爬行效率。安装:通过pip install scrapy-redis即可安装。分布式爬虫的优点:可以充分利用多台...原创 2019-04-02 22:56:40 · 165 阅读 · 0 评论