
python与数据处理
文章平均质量分 76
thequitesunshine007
探索者
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
C++中调用Python的办法
1 背景一直采用C++作为主语言开发,最近遇到一个项目需要解析PDF文件中的文本内容,直接采用C++来做显得不是很方便,但用python来做就显得很简单了。难点在于如何C++语言环境下调用python来实现功能。2 开发环境Python版本为: 3.7.3(32 bit)版本。QT版本为:Qt 5.12.2(MSVC 2017, 32bit)QtCreator中项目的配置如下:重要的事情(版本匹配): 请确保Python版本与QT版本的...原创 2021-08-12 09:46:18 · 992 阅读 · 0 评论 -
python多线程同步(多任务同步分发处理)
线程同步如果多个线程共同对某个数据修改,则可能出现不可预料的结果,为了保证数据的正确性,需要对多个线程进行同步。使用Thread对象的Lock和Rlock可以实现简单的线程同步,这两个对象都有acquire方法和release方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到acquire和release方法之间。如下:多线程的优势在于可以同时运行多个任务(至少感觉起来是这样)。但是当线程需要共享数据时,可能存在数据不同步的问题。考虑这样一种情况:一个列表里所有元素都是0,线程"set转载 2021-06-17 11:10:07 · 923 阅读 · 0 评论 -
pycharm新建项目时选择virtualenv与existing interpreter
虚拟环境及venv和virtualenv介绍:https://www.cnblogs.com/mind18/p/13877170.htmlpip介绍:https://www.cnblogs.com/mind18/p/13877702.html一、为什么要配置python虚拟环境? 每个项目使用的框架库并不一样,或使用框架的版本不一样,这样需要我们根据需求不断的更新或卸载相应的库。直接对我们本地的Python环境操作会让我们的开发环境和项目造成很多不必要的麻烦,管理也相当混乱。如果项目多了,就会造成本转载 2021-06-08 11:26:30 · 3371 阅读 · 0 评论 -
Python读取图片中的文字(OCR)
这里写目录标题1. 安装 tesseract2. 安装 tesseract3. 识别1. 安装 tesseractgithub官方tesseract下载本想安装长期支持版本4.0 LSTM,但在其官网上只找到了5.0.0版本的安装二进制exe文件。又不想源码编译安装那么麻烦,所以就使用5.0.0了。已经将下载的tesseract-ocr-w64-setup-v5.0.0-alpha.20210506.exe上传至网盘。网盘分享安装过程中注意在语言栏勾选中文(chi_sim简体中文, chi_t原创 2021-05-21 10:59:29 · 1974 阅读 · 2 评论 -
使用Python识别/提取PDF中的字符、文字
1.升级Python之前win10 x64操作系统上安装的是python3.7.0版本(此版本也能进行本文的工作)。出于后续识别图片中文字的需要,还是将其升级到了python 3.8版本。并不用卸载旧的 python3.7.0版本,在官网下载python-3.8.10-amd64.exe文件后,安装,将安装目录添加至Path环境变量。同时屏蔽(或删除)之前 python3.7.0版本的环境变量即可。重启PC,新的环境变量生效。2.使用Python识别PDF中字符、文字声明: 所使用的PDF不能是原创 2021-05-21 10:23:04 · 12056 阅读 · 1 评论