
python学习
有梦生
这个作者很懒,什么都没留下…
展开
-
scrapy爬取到的数据为空
网上说是【allowed_domains】需要补全,所以尝试了把【start_urls】的内容复制给了【allowed_domains】,最终尝试了发现是头信息里的cookie没有设置,scrapy默认用了它内部设置的头信息。使用scrapy爬取58同城的数据,发现xpath路径正确,第一次运行确实可以输出数据,但是第二次运行后却返回了一个空列表,代码如下。3.设置headers,添加cookie,以及UA,如果有referer的话也添加进去。又因为第一次运行时能够输出内容,因此排除了xpath路径问题。原创 2024-03-21 22:43:12 · 685 阅读 · 0 评论 -
爬虫中常用到的库和方法总结
urllib和requests在使用过程中常使用的一些方法和数据类型的总结原创 2024-03-21 10:48:42 · 807 阅读 · 0 评论