
Python
Python
码道功成
自我感觉有点笨,总是嫌大牛们写的东西不够详细,所以本人写的博客会尽量通俗易懂~
展开
-
selenium在Linux环境下截屏(save_screenshot)中文乱码的问题
options.add_argument("--lang=zh-CN") # 设置语言为中文。1、设置浏览器options选项。3、安装字体渲染引擎。原创 2025-01-08 17:24:25 · 693 阅读 · 0 评论 -
selenium获取webdriver,并规避反爬
以上代码获取到webdriver,并添加selenium-stealth规避反爬。原创 2024-12-19 15:35:52 · 1119 阅读 · 0 评论 -
使用ddddocr进行网站验证码识别
其中,第1步和第2步,按理说页可以通过find_element方法查找到验证码图片,再获取src属性并保存的方式处理。2、查找到验证码图片元素,获取到元素的location和size信息,基于上一步的图片裁剪出验证码图片;这里使用ddddocr将验证码图片中的文字识别;3、调用ddddocr进行识别;1、将登录页保存为图片;原创 2024-12-19 15:24:07 · 548 阅读 · 0 评论 -
修改anaconda虚拟环境默认配置
这样,以后创建新的虚拟环境就不会在C盘了!原创 2024-08-06 11:21:02 · 280 阅读 · 0 评论 -
vscode连接docker容器并调试Python代码
而开发的项目又无法在本地运行(需要GPU),那调试代码的话就很难受了,好在vscode足够强大,使用插件可以连接docker容器,并基于容器运行调试debug代码。点击左下角绿色的ssh信息,然后弹出让选择远程连接的选项,找到“Dev Containers”分组下的“Attach to Running Container”(当然前提是你的docker容器已经启动起来了)。然后,就能开到连接的服务器上的所有docker容器了,单击选择你的docker容器即可;一、安装Dev Containers插件。原创 2024-07-18 18:20:33 · 2370 阅读 · 0 评论 -
vscode及pycharm配置Python文件模板
第一步,依次点击“File”->“preference”->“Configure User Snippets”,在弹出的框中输入Python,打开python.json 文件。第三步,把“Enable Live Templates”的勾选中,点击“apply”,“OK”即可,新建一个文件,模板内容会自动插入到文件中。第三步,新建一个文件,输入"pt",然后按下"Tab"键,模板内容会自动插入到文件中。二、pycharm配置方法。一、vscode配置方法。原创 2024-07-18 18:19:41 · 1191 阅读 · 0 评论 -
pandas中loc、iloc、at、iat的区别
废话不多说,直接上代码。原创 2024-04-25 15:47:16 · 472 阅读 · 1 评论 -
使用进程池处理数据
那如果需传递其它额外参数,那就得使用partial(偏函数)将处理单个进程作业的函数与参数包起来,示例中就是 func = partial(test_process, len(arr)) 这一行,函数名要放在第一个,后面依次按需放多个参数。那就使用数组呗,将df转为字典数组,其中test_process为处理单个进程作业的函数,param1, param2,param3分别为额外的传参;其中param1, param2,param3分别对应上面的传参,line对应的当前行的数据。2、进程池传递多个参数。原创 2024-03-01 15:51:36 · 531 阅读 · 0 评论 -
Linux环境下运行selenium4.14
2) 根据谷歌浏览器版本下载对应的浏览器驱动版本。(这个页面里是高版本的驱动)1)运行下面命令查看浏览器版本。(这个页面是低版本的驱动)原创 2023-10-31 16:41:56 · 1631 阅读 · 0 评论 -
python爬虫报错:This version of ChromeDriver only supports Chrome version 114
它是一个开源的Java库,以完全自动化的方式执行Selenium WebDriver所需的驱动程序的管理(即下载、设置和维护)。其最新版本提供了其他相关功能,如发现本地系统中安装的浏览器的能力,无缝运行Docker容器中的浏览器,以及监控能力,废话不多说,直接上代码。然后,使用浏览器版本,它试图通过各种方法找到合适的驱动程序版本。修改Python代码,添加executable_path参数,指定浏览器驱动路径。这里下载浏览器对应的驱动,可是我的浏览器是117版本的,这里面根本找不到。2)换浏览器驱动版本;原创 2023-10-30 14:58:26 · 1758 阅读 · 0 评论 -
pandas使用笔记
【代码】pandas使用笔记。原创 2023-09-27 14:15:21 · 283 阅读 · 0 评论 -
Python反爬取访问验证处理
这种验证方式没找到绕过去的方法,那就只能用最笨的办法,弹出验证框后,将等待时间延长,然后手动点击验证。原创 2023-07-07 15:02:04 · 1138 阅读 · 0 评论 -
Python常用方法
out_path:输出文件路径;datas:字典数组;mode:追加(a)或者覆盖(w)#如果在Python2.x下添加了上面的配置还出现中文乱码,则加以下配置。# 将 jsonl 数据写入文件。在.py文件头部添加这行代码。原创 2023-06-20 14:48:21 · 270 阅读 · 0 评论 -
Python操作mysql
此处有个坑,就是字符串的格式化 s%必须用括号括起来, 我最初是这样写的:sql = "update gpt_exams_test set question_desc_distinct='%s',question_desc_text='%s' where question_id=%s",结果一直报SQL语法错误。使用pandas的优点是返回的结果是DataFrame,我们可以基于DataFrame取数更方便。单条插入和单条更新其实是一样的,只不过传入的SQL不同而已。# 使用with指定文件编码。原创 2023-06-20 14:42:12 · 471 阅读 · 0 评论