- 博客(12)
- 收藏
- 关注
原创 python爬虫爬取的图片提示未加载,尝试外部打开以修正格式
原因还是写多了请求头requests,记住requests不要写满,只写必要的几个,requests会帮你补充的。
2024-02-01 16:27:28
1180
3
原创 pyspider学习过程1、pyspider的安装和注意事项
一般来说按照下面的的过程基本上就可以使用了但是也有另一种情况如下遇到箭头指的错误,在运行pyspider时会报错 “ImportError: cannot import name 'ContextVar' ”原因是flask版本太高,导致不兼容。只需要卸载flask然后安装1.0版本就可以了,如下暂时没有了...
2022-03-21 16:03:44
1065
原创 分布式爬虫2后半段
这里的ITEM_PIPELINES只留scrapy_redis,因为这里是将数据传输到redis数据库中,然后再将数据传输到mysql中。下图是将redis中的数据传输到mysql中的代码需要注意的在图片的注释里。下面是运行成功的图片在redis可视化工具中进行Reload,刷新发现只剩下进行去重的指纹(zh:dupefilter)数据,表示数据已经传输到mysql里了,打开navicate就会发现数据的存在。...
2022-03-08 22:05:11
372
原创 KeyError(f“{self.__class__.__name__} does not support field: {key}“)问题解决过程
2022-01-14 21:13:57
921
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人