
爬虫
文章平均质量分 57
yuxuan6699
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python+selenium解决报错:SessionNotCreatedException session not created: No matching capabilities found
报错:selenium.common.exceptions.SessionNotCreatedException: Message: session not created: No matching capabilities found。原创 2023-11-27 23:44:33 · 2621 阅读 · 0 评论 -
ChromeDriver最新版本下载与安装方法
3.在环境变量设置中,找到名为“PATH”的变量,并在其值中添加ChromeDriver的路径。例如,如果将ChromeDriver解压缩到“C:\chromedriver”(Windows)或“/usr/local/bin/chromedriver”(macOS / Linux),则需要将该路径添加到PATH变量中。请记住,确保下载与Chrome浏览器版本匹配的ChromeDriver,并将其正确添加到系统的PATH环境变量中。这将打开一个新的标签页,显示当前安装的Chrome浏览器的版本号。原创 2023-11-27 14:49:36 · 60931 阅读 · 7 评论 -
爬虫、Selenium、webUI自动化使用PIL+pytesseract识别验证码以及识别错误解决方案
背景:大家在做爬虫或web端的UI自动化时会经常遇到的就是验证码,那怎么识别这验证码也是我们目前遇到的难题。(在这里咱们先不讨论:1.点击类的验证 2.滑动类的验证 3.中文类的验证)简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。计算机涉及到的几何图形处理一般有 2维到n维图形处理,边界区分,面积计算,体积计算,扭曲变形校正。对于颜色则有色彩空间的计原创 2020-06-12 11:44:24 · 597 阅读 · 0 评论 -
第一次爬虫案例
最近爬取了一个音频直播的网站,我们从中提取,直播的标题名称,音频源的地址;爬虫的基本流程:1、发起请求通过HTTP库向目标站点发起请求,也就是发送一个Request,请求可以包含额外的header等信息,等待服务器响应获取响应内容如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取的页面内容,类型可能是HTML,Json字符串,...原创 2019-06-21 18:01:44 · 319 阅读 · 1 评论