
python 系列
文章平均质量分 85
python的应用场景
短尾流浪猫
这个作者很懒,什么都没留下…
展开
-
python 系列 07 - 基于easyocr的ocr识别
OCR,光学文字识别,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。本示例通过easyocr库来演示。easyocr是一个比较流行的库,支持超过80种语言。安装的时候注意会附带安装torch库(一个深度学习框架,大小600多M)。目前还不支持最新版的python3.11.如果你是最新版的pyton。可以对python降级或者安装另一个版本的python。切换python版本详见文末。原创 2023-05-06 21:21:12 · 3995 阅读 · 2 评论 -
python 系列 06 -生成及解析二维码
二维码不止一种,本文介绍最常见的QR二维码。由于不能发二维码截图,所以所有的执行结果都隐去了。原创 2023-04-01 13:48:35 · 1379 阅读 · 0 评论 -
python 系列 05 -数据可视化
关于库的选择,这里不再对常用的可视化库作对比,直接用Plotly。原创 2023-03-04 22:20:42 · 923 阅读 · 0 评论 -
python 系列 04 - 解析及创建PDF
介绍之前,我们通过读取一个已有的PDF中的文字来测试下时提取内容的准确度,pdfrw暂时跳过,因为没有找到其提取文本的api。ReportLab不能读,跳过。原创 2023-02-03 23:59:21 · 1302 阅读 · 0 评论 -
python 系列 03 - 基于scrapy框架的简单爬虫
Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。一个简单的图片爬虫就完成了,一个功能复杂的爬虫,还需要解决登陆,分页,或者爬取到结果后入库等操作,这里就不多做解释,以后有空会更新登陆,分页等其他功能,没有空就不更新了。最后还要说明一点,爬取网络内容时请遵守相关法律法规,和网站规则。一般网站的根目录下都有robots.txt文件,请确保遵循了robots.txt的规则。比如。原创 2023-01-19 10:55:26 · 3354 阅读 · 1 评论 -
python 系列 02 - java web代码生成器
代码主要用于生成java web mvc开发需要的entity,dao,service,controller层文件以及公用的mapper文件,基于数据库表结构生成,基于mysql数据库,需要用到的第三方库主要是python连接mysql的库pymysql。通过命令安装即可。如有不合适的地方请拷贝代码自行修改或定制功能。原创 2023-01-13 23:58:28 · 579 阅读 · 0 评论 -
python 系列 01 - 创建和解析office文档
本例环境基于ubuntu18.04,python3,wps。所有本例用到的类库都使用pip3来安装。首先安装pip3。sudo apt install pip3 1. python处理word文档安装处理word文档用到的python类库python-docx。pip3 install python-docx...原创 2020-07-03 15:06:00 · 4114 阅读 · 2 评论