
爬虫
CaoMei_HuaCha
自律,
勤勉
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
问题:(爬虫)使用jsonpath报错requests.exceptions.ConnectionError: [Errno -3] Temporary failure...
想要获取拉钩网站上的地区的内容,并且配好了headers报错内容如下:requests.exceptions.ConnectionError: HTTPConnectionPool(host='www.lagou.com', port=80): Max retries exceeded with url: /lbs/getAllCitySearchLabels.json (Caused b...原创 2018-12-04 14:06:24 · 1223 阅读 · 0 评论 -
(爬虫):日志位置出现警告-----UserWarning: No parser was explicitly specified
(爬虫):日志位置出现警告-----使用BeautifulSoup时,出现了这个问题:意思是,如果我们没有显式地指定解析器。所以默认使用这个系统的最佳可用HTML解析器(“lxml”)。如果你在另一个系统中运行这段代码,或者在不同的虚拟环境中,使用不同的解析器造成行为不同。但是我们可以通过soup = BeautifulSoup(html, 'lxml')方式指定lxm...原创 2018-12-07 11:10:29 · 3585 阅读 · 1 评论 -
如何安装PhantomJS,和使用
首先下载,然后解压,将执行文件放到指定目录下wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2tar -xvjf phantomjs-2.1.1-linux-x86_64.tar.bz2 sudo cp -R phantomjs-2.1.1-linux-x86...原创 2018-12-17 10:33:29 · 256 阅读 · 0 评论 -
(爬虫)使用ChromeDriver时报错unknown error: Chrome failed to start: exited normally
百度查询后,发现是自己的版本号没有对应上,我随便下载了一个72.0,结果出现这中报错 selenium.common.exceptions.WebDriverException: Message: unknown error: Chrome failed to start: exited normally (unknown error: Devtools port number fi...原创 2018-12-17 14:45:21 · 24493 阅读 · 0 评论