Python
文章平均质量分 73
秃头老佛爷
日积月累,慢慢行慢慢积,文章属个人笔记,有错误之处,还望指正
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python使用PDF相关组件案例详解
pdfminer.six 是一个专门用来从 PDF 中提取文本的库,能够处理复杂的文本布局,适合用于文本解析,尤其是需要了解 PDF 页面的结构时。pdfplumber 是一个基于 pdfminer.six 的工具,专门用于提取 PDF 中的表格、文本、图像等结构化内容。PyMuPDF 是一个强大的 PDF、XPS、EPUB 等格式的文档处理库,支持提取文本、图像和页面渲染等多种功能。PyPDF2 是一个用于 PDF 文档操作的库,支持 PDF 文件的合并、拆分、旋转、裁剪等。原创 2024-11-07 17:05:11 · 1174 阅读 · 0 评论 -
Python中pandas组件学习总结
(二维数据表),提供了丰富的功能来处理各种格式的数据,pandas 是数据分析和处理的核心工具,掌握它的基本操作及优化技巧能大大提升工作效率。Series 是 pandas 的一维数组,类似于 Python 中的列表,但它可以附带标签(索引),用于标识每个元素。DataFrame 是 pandas 中的二维数据结构,类似于一个表格,拥有行和列,能够保存不同类型的数据。中非常强大的数据处理和分析库,广泛应用于数据清洗、数据分析和数据可视化等领域。使用 loc[] 和 iloc[] 进行数据的访问。原创 2024-11-07 16:46:43 · 653 阅读 · 0 评论 -
Python处理PDF组件使用及注意事项
它提供了比 pdfminer.six 更简单的 API,可以更容易地提取 PDF 中的表格,同时支持文本和图像提取。PyPDF2 和 PyPDF4 都是功能强大的 PDF 操作库,适用于合并、拆分、旋转 PDF 文件,提取 PDF 元数据等。pdfminer.six 是一个强大的 PDF 文本提取库,尤其适用于精确提取页面上的文本,支持复杂的文本布局、字体、字符信息的提取。PyMuPDF(也叫 fitz)是一个非常强大的 PDF 处理库,支持文本、图像、页面渲染和注释提取等功能。原创 2024-11-07 16:33:18 · 1436 阅读 · 0 评论 -
Python学习大纲总结及注意事项
1. 变量命名规范2. 避免使用可变默认参数3. 注重代码的可读性4. 理解浅拷贝和深拷贝5. 用is判断None6. 条件表达式中的and和or短路7. 理解迭代器与生成器8. 避免过多的嵌套。原创 2024-11-06 15:17:22 · 889 阅读 · 0 评论
分享