redis把数据保存在内存
MongoDB把数据保存在硬盘
pip install scrapy-redis
easy_install scrapy-redis
或者下载安装包下载。
scrapy 配置redis,在settings.py文件中配置redis
默认端口6379
#-*-coding:utf8-*- from scrapy_redis.spiders import RedisSpider from scrapy.selector import Selector from scrapy.http import Request from novelspider.items import NovelspiderItem import re class novSpider(RedisSpider): name = "novspider" redis_key = 'nvospider:start_urls' start_urls = ['http://www.daomubiji.com/' #'http://www.daomubiji.com/qi-xing-lu-wang-01.html' ] def parse(self,response): selector = Selector(response) table = selector.xpath('//table')

本文介绍如何将Scrapy爬虫框架与Redis数据库结合使用,包括安装Scrapy-Redis组件、配置Scrapy以使用Redis作为任务队列以及具体实现代码示例。
2432

被折叠的 条评论
为什么被折叠?



