今天在写scrapy爬取网站时,列表页的url请求详情页的url,不执行也不报错,最后发现是yield scrapy.Request中少了dont_filter=true 没有时 有的时候 dont_filter到底是什么? dont_filter,是关闭去重的,scrapy会对request的URL去重(RFPDupeFilter),加上dont_filter则告诉它这个URL不参与去重,而且不会被allowed_domains域名过滤掉