
python学习
文章平均质量分 76
飞向天空的鹰
热爱编程,热爱代码。
好记性比不过烂笔头,希望也能帮到大家,学无止境,一起进步吧...
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
windows无界面后台定时任务 (重启自启动,ODBS为例)
ODBS原创 2025-03-07 18:31:23 · 889 阅读 · 0 评论 -
总结一些 paddleocr 安装运行产生的问题
原因:电脑上没有安装Visual C++ 2015-2019 Redistributable(x64)解决方案1.安装 VC_redist.x64pwd=rkib2.验证:安装完成后您可以使用 python 进入 python 解释器,输入如下如果出现 PaddlePaddle is installed successfully 说明您已成功安装。没有写完,后面又再加~希望可以帮助到需要的朋友们,小东西真的烦~paddleocr安装介绍传送。原创 2024-12-10 16:42:40 · 1067 阅读 · 0 评论 -
解决pyinstaller 打包 ddddocr 库方法
ddddocr 库 在打包成 exe 文件后一直有各种各样的问题。无法运行。总是提示缺少 onnxruntime_providers_shared.dll 等问题。例如下图:所以这里总结一下打包解决方法。原创 2024-10-12 10:52:07 · 1470 阅读 · 0 评论 -
小工具 - Python图片转PDF文件
主要整理记载一些python实现的小脚本,网上基本转换要会员,懒得搞了,这个一键生成,可以打包成exe文件使用。原创 2023-10-19 16:11:04 · 987 阅读 · 0 评论 -
Python 远程控制 Windows 服务器
前言在很多企业会使用闲置的 Windows 机器作为临时服务器,有时候我们想远程调用里面的程序或查看日志文件Windows 内置的服务「 winrm 」可以满足我们的需求它是一种基于标准简单对象访问协议( SOAP )的防火墙友好协议,允许来自不同供应商的硬件和操作系统进行互操作官网:https://docs.microsoft.com/en-us/windows/win32/winrm/portal1. 被控端 windows这里以 Windows 10 系统机器为例具体操作步骤如下:1-转载 2022-05-16 15:46:53 · 1464 阅读 · 1 评论 -
总结:用Python实现定时任务的八种方案
前言目前为止,在我工作中,常常会用到需要周期性执行的任务,其中,第一种方式是采用 Linux 系统自带的 crond 结合命令行实现。另外一种方式是直接使用Python。因此,我总结整理了下的是常见的Python定时任务的实现方式,方便给需要的人采用。定时目录方案利用while True: + sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现定时任务利用任务框架APSchedule原创 2021-10-13 17:24:37 · 921 阅读 · 0 评论 -
记录:weditor/uiautomator 报错出现 cannot identify image file 解决方案
前言由于现在做的移动端多设备群控框架已经搭建的差不多,手中的手机设备也有10多台在群控运行,有小米,红米,荣耀,vivo,oppo ,华为不同的手机设备都有在用。每天完成不同的任务需求抓取。在此期间每次配置设备时有的手机安装atx在weditor上运行时总会报错关于 cannot identify image file <_io.BytesIO object at 0x0000015F5F6E2FC0> 等类似错误,如图:对此,也困扰了我一段时间,网上也没有类似案例查询,只能一步步的自己原创 2021-07-05 16:52:05 · 3398 阅读 · 2 评论 -
Dict 的实现原理
简介Python内部很地方都使用着dict这种结构,在对象属性__dict__就是一个字典,所以对其效率要求很高。从接口上和实现上,python的dict都算是一种hashmap。dict采用了哈希表,最低能在 O(1)时间内完成搜索。同样的java的HashMap也是采用了哈希表实现,不同是dict在发生哈希冲突的时候采用了开放寻址法,而HashMap采用了链接法。二. 字典是否是有序的?在Python3.6之前,字典是无序的,但是Python3.7+,字典是有序的。在3.6中,字典有序是一个i原创 2021-06-11 17:40:07 · 834 阅读 · 1 评论 -
Pandas常用操作方法
本文总结自己经常使用的pandas操作方法:import pandas as pdimport numpy as np1、创建DataFrame数据方式1:通过字典直接创建df1 = pd.DataFrame({ "name":["小明","小红","小孙","王小","关宇","刘蓓","张菲"], "age":[20,18,27,20,28,18,25], "sex":["男","女","男","男","男","女","女"], "score":[6原创 2021-05-07 12:16:52 · 3146 阅读 · 0 评论 -
Python 自动化脚本部署服务器流程
前言目前在理财通做定时自动化爬虫,之前完成的代码实现的部分,现在本地运行稳定后,就考虑将它部署到服务器,根据自己的定时任务在固定的时间自动启动抓取任务。但是,由于自动化程序与平台兼容性有关联,有一些依赖库在服务器运行需要做特殊处理本篇文章以一段 Selenium 编写的 Python 自动化程序,聊聊脚本部署服务器的详细过程操作步骤以 CentOS 服务器为例2-1安装桌面环境PS:如果已经安装,可以跳到下一步我们需要先安装一个桌面环境「以GNOME 为例」,设置以...原创 2021-03-17 09:46:11 · 1404 阅读 · 0 评论 -
Python 操作 MySQL的方法
前言在爬虫、自动化、数据分析、软件测试、Web 等日常操作中,除JSON、YAML、XML 外,还有一些数据经常会用到,比如:Mysql、Sqlite、Redis、MongoDB、Memchache等一般情况下,我们都会使用特定的客户端或命令行工具去操作;但是如果涉及到工程项目,将这部分数据操作集成到代码中使用才是王道准备首先,我们通过 Mysql 客户端或命令行创建一个数据库xh然后,在这个数据库下建一张简单的表people为了便于演示,这里只创建了三个字段:id、nam...原创 2021-02-08 17:57:31 · 2435 阅读 · 1 评论 -
记:解决 RuntimeError: atx-agent recover failed 和 requests.exceptions.ProxyError
今天运行 uiautomator2 突然用不了,一直显示报错:RuntimeError: atx-agent recover failed然后cmd 输入:adb devices,查询安卓设备,发现设备正常连接,心里就很纳闷了然后百度查找问题发现基本上很少有这样的帖子,看到一个说是库的问题,安装下 :pip install --upgrade --pre uiautomator2发现安装不了,还发现了一个请求错误,请求正常requests也是一样的!!raise ProxyErr...原创 2020-05-21 18:57:58 · 1524 阅读 · 2 评论 -
总结:Python 图像处理
目录1、灰度化功能2、反转功能3、通道分离功能4、噪音、滤波功能5、高斯双边滤波功能6、均值偏移滤波功能7、图像二值化功能8、Canny边缘检测功能9、直线检测功能10、圆形检测功能11、轮廓发现功能12、人脸检测功能该项目可实现图像的多样化处理,基本上包含了OpenCV模块常用的图像处理功能,非常适合初学者理解和应用,包括:灰度化功能、反转功能、通道分离功能、噪音滤波功能、高斯双边滤波功能、均值偏移滤波功能、图像二值化功能、Canny边缘检测功能、直线检原创 2020-05-14 18:51:02 · 3288 阅读 · 1 评论 -
由 method may be static 引发的 Python PEP8 总结
前言最近在进行Python开发的时候会遇到这个问题:PyCharm:method may be static,没啥问题,但一直影响代码美观,如下图这是因为我们在类中所声明的方法没有使用类中的变量。它告诉我们这是一个静态方法,并且可以安全的声明为静态类型。解决方法如下:删除静态方法中的self,然后在这个方法的上一行声明一下就可以啦。如下图:PEP8规范因此,再次也多做点记录关于Python PEP8 代码规范如果想要选择性忽略PEP8代码风格的警告信息可以使用以下方法:.原创 2020-05-14 17:00:12 · 2073 阅读 · 0 评论 -
Python - 邮件发送【包括附件, 定时】
简介python发邮件需要两个模块,smtplib和email,都是Python自带库。smtplib 模块主要负责发送邮件:是一个发送邮件的动作,连接邮箱服务器,登录邮箱,发送邮件(有发件人,收信人,邮件内容)。email 模块主要负责构造邮件:指的是邮箱页面显示的一些构造,如发件人,收件人,主题,正文,附件等。具体操作demo代码import timeimport smtplibfrom email.mime.text import MIMETextfrom email转载 2020-05-09 11:43:29 · 340 阅读 · 0 评论 -
Python 定时框架 - Apscheduler
前言由于最近项目组要做爬虫需要一些自动化的工作,一直没时间,今天在此做个记录,给需要的小伙伴~ 在我们的日常工作自动化测试当中,几乎超过一半的功能都需要利用定时的任务来推动触发,例如在我们项目中有一个定时监控模块,根据自己设置的频率定时跑测试用例,定时检测是否存在线上紧急任务等等,这些都涉及到了有关定时任务的问题。很多情况下,大多数人会选择window的任务计划程序,但如果程序不在win...原创 2019-12-20 14:55:46 · 5173 阅读 · 0 评论 -
Python处理pdf文件 - pdfminer、pdfplumber
pdfminer3kpdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本from pdfminer.pdfparser import PDFParser, PDFDocumentfrom pdfminer.pdfparser import PDFPagefrom pdfminer.pdfinterp import PDFResource...原创 2019-08-07 15:55:28 · 9865 阅读 · 3 评论 -
个人总结 - 垃圾回收机制原理
Python的GC模块采用的是引用计数机制为主,标记-清除和分代收集两种机制为辅的策略。1、主要运用了引用计数 ===》 来跟踪和回收垃圾 (缺点:可能出现循环引用)2、通过 ’标记-清除‘ ===》 解决容器对象可能产生的循环引用的问题 (标记和清除过程效率不高)3、分代回收 ===》 以空间换取时间进一步提高垃圾回收的效率...原创 2019-08-19 11:29:31 · 631 阅读 · 0 评论 -
python从PDF文件中爬取表格数据 - camelot
简介camelot是Python的一个模块,它能够让任何人轻松地从PDF文件中提取表格数据。(安装时间较长):pip install camelot-pycamelot模块的官方文档地址为:https://camelot-py.readthedocs.io/en/master/案例首先,让我们看一个简单的例子:eg.pdf,整个文件只有一页,这一页中只有一个表格,如下:...原创 2019-08-07 16:23:03 · 5164 阅读 · 3 评论 -
个人总结 - python内存管理机制原理
内存管理Python中的内存管理机制的层次结构提供了4层,其中最底层则是C运行的malloc和free接口,往上的三层才是由Python实现并且维护的。 Layer0层是C运行的malloc和free接口Layer1层则是在Layer0层的基础之上对其提供的接口进行了统一的封装这是因...原创 2019-08-19 11:44:54 · 910 阅读 · 0 评论 -
模拟登陆 - 破解12306验证码
12306模拟登陆demo:用selenium来进行模拟登陆操作,主要是这个验证码部分。https://kyfw.12306.cn/otn/resources/login.html这个验证码解决的方法,可以利用机器学习。1、让计算机能够不断在互联网上搜集不同图片和其相应的“标签”2、经过大量图片和相应标签的训练,计算机习得了各种不同标签图片之间的差别与关系。形成...转载 2019-08-07 17:50:34 · 752 阅读 · 0 评论 -
理解图像分类和零样本目标识别的区别
图像分类和零样本目标识别有啥不同?图像分类 拿12306火车票图片来说吧,总共80种,比如其中一类为红枣,给你100个红枣的图片,尽管这100个红枣的图片千差万别,但都是红枣,机器就拿这100个样本学习并记住其特征,比如红色的、椭圆的,表皮有褶皱的等等。 同样,对于另外79种,也一样操作,学习完成了,你给一张图片,给机器识别,机器提取该张图片的特征后,在学习过的80种中间挑出机器认为概率...原创 2019-08-07 18:06:16 · 3227 阅读 · 0 评论 -
迭代器与生成器原理及关系
迭代器含有iter和next方法 (包含next方法的可迭代对象就是迭代器)迭代也叫遍历,作用是节约内存,应用场景:range/xrange,可以使用 isinstance() 判断一个对象是否是 Iterable 对象可迭代对象 :一个类内部实现iter方法且返回一个迭代器。可迭代的对象 :一类:list,tuple,dict,set,str 二类:generator,包含...原创 2019-08-19 14:41:19 · 1548 阅读 · 0 评论 -
python多进程 - 进程间的通信(Queue,Pipe,Value/Array,Manager)
前言与多线程不同,多进程之间不会共享全局变量,所以多进程通信需要借助“外力”。在Python中,这些常用的外力有Queue,Pipe,Value/Array和Manager。Queue这里的Queue不是queue模块中的Queue——它在多进程中无法起到通信作用,我们需要multiprocessing模块下的。同时,由于Python的完美封装,它的实现原理可以说是对程序员完全透明,使...原创 2019-08-16 09:02:31 · 3041 阅读 · 0 评论 -
python多线程 - 线程间通信(全局变量、queue)
简介什么是线程间通信呢? 多个线程处理同一资源,但是任务不同为什么要通信?如果各个线程之间各干各的,确实不需要通信,这样的代码也十分的简单。但这一般是不可能的,至少线程要和主线程进行通信,不然计算结果等内容无法取回。而实际情况中要复杂的多,多个线程间需要交换数据,才能得到正确的执行结果。1、共享变量(全局变量)线程间通过共享同一个全局变量进程通讯最...原创 2019-08-16 09:46:26 · 15695 阅读 · 0 评论 -
Python协程的引入与原理分析 - IO多路复用
1、概念协程,又称微线程,纤程。英文名Coroutine协程的概念应该是从进程和线程演变而来的,他们都是独立的执行一段代码,但是不同是线程比进程要轻量级,协程比线程还要轻量级。多线程在同一个进程中执行,而协程通常也是在一个线程当中执行。我们都知道Python由于GIL原因,其线程效率并不高,并且在*nix系统中,创建线程的开销并不比进程小,因此在并发操作时,多线程的效率还是受到了很大制...原创 2019-08-16 10:54:56 · 948 阅读 · 0 评论 -
异步IO爬虫 - asyncio、aiohttp
在执行一些 IO 密集型任务的时候,程序常常会因为等待 IO 而阻塞。比如在网络爬虫中,如果我们使用 requests 库来进行请求的话,如果网站响应速度过慢,程序一直在等待网站响应,最后导致其爬取效率是非常非常低的。为了解决这类问题,本文就来探讨一下 Python 中异步协程来加速的方法,此种方法对于 IO 密集型任务非常有效。如将其应用到网络爬虫中,爬取效率甚至可以成百倍地提升,同时这也是...原创 2019-08-27 12:38:48 · 1144 阅读 · 1 评论 -
如何在云服务器上自动运行.py文件
在linux上操作方法,保证你在云服务器上运行的目的是保持一直运行利用screen会话分离因为在Screen环境下,所有的会话都独立的运行,并拥有各自的编号、输入、输出和窗口缓存。基本步骤:1、安装 screen:yum install screen2、创建screen -S xx(注释:-S,意思是创建一个screen分屏环境。S是大写,xx是分屏的名字)3、运...转载 2019-08-13 14:28:45 · 2992 阅读 · 0 评论