scrapy处理其他类型状态码
如果不做处理,当scrapy获取的页面为404或者其他状态码的时候scrapy会跳过处理这些页面,不会进入类似下面代码中的处理方法。
如果需要使用类似方法处理相关状态码,只需要在爬虫类中加上
handle_httpstatus_list = [404]
即可。
如果不做处理,当scrapy获取的页面为404或者其他状态码的时候scrapy会跳过处理这些页面,不会进入类似下面代码中的处理方法。
如果需要使用类似方法处理相关状态码,只需要在爬虫类中加上
handle_httpstatus_list = [404]
即可。