scrapy-settings

 

项目名称
BOT_NAME = ''

爬虫存储的文件路径
SPIDER_MODULES = ['']

创建爬虫文件的模板,创建好的爬虫文件会存放在这个目录下
NEWSPIDER_MODULE = ''

设置ua,模拟浏览器请求
USER_AGENT = ''

设置是否需要遵守robot协议:默认为True
ROBOTSTXT_OBEY = True/False

设置请求的最大并发数据(下载器),默认16个
CONCURRENT_REQUESTS = int

设置请求的下载延时,默认为0
DOWNLOAD_DELAY = int

设置网站的最大并发请求数量,默认是8
CONCURRENT_REQUESTS_PER_DOMAIN = int

设置某个IP的最大并发请求数量,默认是0
CONCURRENT_REQUESTS_PER_IP = int
如果非0,
CONCURRENT_REQUESTS_PER_DOMAIN不生效,这时候请求的并发数量将针对于IP,而不是网站了
设置的DOWNLOAD_DELAY就是针对于ip而不是网站了

是否携带cookie,默认为True
COOKIES_ENABLED = True/False

跟踪cookies,默认情况下是False
COOKIES_DEBUG = True

是一个终端的扩展插件,
TELNETCONSOLE_ENABLED = True/False

设置默认请求头
DEFAULT_REQUEST_HEADERS = {}

设置和激活爬虫中间件
SPIDER_MIDDLEWARES = {}

设置和激活下载中间件
DOWNLOADER_MIDDLEWARES = {}

设置扩展
EXTENSIONS = {}

设置和激活管道文件,后面的数字表示优先级
ITEM_PIPELINES = {}

默认情况下自动限速的扩展是关闭的:AUTOTHROTTLE_ENABLED = False
AUTOTHROTTLE_ENABLED = True/False
初始的下载延时默认是4秒
AUTOTHROTTLE_START_DELAY = int
最大下载延时
AUTOTHROTTLE_MAX_DELAY = int
针对于网站的最大的并行请求数量
AUTOTHROTTLE_TARGET_CONCURRENCY = int
调试模式,默认为True
AUTOTHROTTLE_DEBUG = True/False

设置数据的缓存,默认情况下是未开启的
AUTOTHROTTLE_DEBUG = True/Flase
设置缓存的超时时间,默认为0为永远有效
HTTPCACHE_EXPIRATION_SECS = 0
设置缓存的存储文件路径
HTTPCACHE_DIR = 'httpcache'
忽略某些状态码的请求结果(Response)
HTTPCACHE_IGNORE_HTTP_CODES = []
开启缓存的扩展插件
HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'

设置日志信息
LOG_FILE = 'xcf.log'
LOG_LEVEL = 'INFO'



作者:渡舟_清酒
链接:https://www.jianshu.com/p/0a762bc5c145
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

下载前可以先看下教程 https://pan.quark.cn/s/a4b39357ea24 SSM框架,涵盖了Spring MVC、Spring以及MyBatis这三个框架,在Java领域内作为构建Web应用程序的常用架构而备受青睐,特别是在电子商务购物平台的设计与实现过程中展现出极高的应用价值。 这三个框架各自承担着特定的功能角色,通过协同运作来达成高效且灵活的业务处理目标。 Spring MVC作为Spring体系结构中的一个关键部分,主要致力于处理HTTP请求与响应,并推行模型-视图-控制器(MVC)的设计模式。 其运作机制中,DispatcherServlet扮演着前端控制器的角色,负责接收HTTP请求,并将其依据请求映射至相应的Controller处理方法。 在Controller执行完业务逻辑后,会将处理结果传递给ModelAndView对象,随后由ViewResolver将其解析为具体视图进行呈现。 Spring MVC还具备数据绑定、验证以及国际化等附加功能,这些特性显著提升了开发工作的效率以及代码的可维护程度。 Spring框架则是一个综合性的企业级应用开发框架,其核心能力包含依赖注入(DI)、面向切面编程(AOP)以及事务管理等关键特性。 DI机制使得开发者能够借助配置文件或注解手段来管理对象的生成与依赖关联,从而有效降低组件之间的耦合性。 AOP技术则适用于实现诸如日志记录、权限管理这类跨领域的功能需求,有助于使代码结构更为清晰。 Spring在事务管理方面提供了编程式和声明式两种处理途径,确保了数据操作过程遵循原子性与一致性原则。 MyBatis则是一个轻量级的数据库访问层框架,其特点在于将SQL语句与Java代码进行分离,并支持动态SQL的编写。 开发者可以在XM...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值