
scrapy
螺纹钢铁侠
这个作者很懒,什么都没留下…
展开
-
scrapy 代理IP资源分配难点
代理IP总资源有限 向代 理商请求IP的速度有限制 单个IP并发限制 单个IP有时效,且不统一 目标网站封IP策略未可知,只能试探原创 2019-12-18 20:15:34 · 235 阅读 · 0 评论 -
scrapy CrawlSpider LinkExtractor如何提取img里的src?
rules = ( Rule(LinkExtractor(allow=r'bizhi/'), callback='parse_item', follow=True), Rule(LinkExtractor(tags=['img'],attrs='src'), callback='download_jpg',follow=False), ) def d...原创 2019-12-11 12:25:53 · 953 阅读 · 2 评论