
办公自动化
梦因you而美
因为坚守,所以花开不败!
展开
-
批量给图片添加水印
利用Python可以编写个性化自定义的文字水印,而且只需编写一遍,便可永久免费重复使用!原创 2024-07-12 10:58:37 · 591 阅读 · 0 评论 -
word 文本差异比较
不怕客户需求多,就怕不知道 Python 多强大在跟客户沟通需求的时候,科技部老总提出一个问题。能不能实现文本差异比较,实现文件版本管理。其实客户的实际需求是,比较客户签订的合同和公司标准合同的变更,公司在审合同时会占用很多时间。所以上网查找相关资料,整理为如下代码供大家参考:import docximport codecsfrom difflib import HtmlDiff...原创 2019-03-22 09:11:39 · 3049 阅读 · 0 评论 -
鼠标拖拽功能
DLL(Dynamic Link Library)文件为动态链接库文件,又称“应用程序拓展”,是软件文件类型。控制鼠标的拖拽功能需要相应的dll文件,下载地址:https://download.youkuaiyun.com/download/apollo_miracle/11190741自定义函数 imouse_dragfrom ctypes import *from ctypes.winty...原创 2019-05-21 10:04:12 · 1927 阅读 · 0 评论 -
使用Python + fitz + PIL+ pytesseract 解析PDF
之前想了很多种办法来解析PDF文件内容(Python 读取PDF文件),一般针对电子版word或者Excel转化为PDF的PDF文件具有不错的效果,但是依然不能解析图片(图片中文字)内容,如果PDF是扫描版呢,那种方法就不行了。所以我又想了另一个办法,就是先把PDF文件转化为图片,然后再将图片进行OCR识别,得到最终PDF的内容。1 把PDF转化为图片可以参考博文:windows下用P...原创 2019-09-08 10:28:36 · 5963 阅读 · 1 评论 -
python删除重复文件
使用场景网上爬取的图片重复量太大,需要删除重复图片。环境python 3hashilib分析一下这个问题:首先,文件个数非常多,手工查找是不现实的,再说,单凭我们肉眼,在几千张图片或文件里面找到完全相同的难度也是很大的。所以要用程序实现。那么用程序怎么实现呢?根据什么判断两个文件完全相同呢?首先,根据文件名判断是靠不住的,因为文件名可以被随意更改,但文件内容不变。再...原创 2020-01-29 20:14:24 · 4534 阅读 · 7 评论 -
Python 读取PDF文件
首先需要安装 pdfminer3k库:pip install pdfminer3kfrom pdfminer.pdfparser import PDFParserfrom pdfminer.pdfdocument import PDFDocumentfrom pdfminer.pdfpage import PDFPagefrom pdfminer.pdfpage impor...原创 2019-09-07 16:30:57 · 1939 阅读 · 0 评论 -
根据制式模板批量生成 word 文件
操作 word 其实是一件很痛苦的事情,但是有一点我们是可以尝试一下的,那就是根据制式的 word 模板批量生成文件,可以应用在政府机关某些文件下发里,再配合邮件发送功能。今天就给大家分享一下生成 word 文件的代码制式的 word 模板如下:代码如下:from docxtpl import DocxTemplatetpl = DocxTemplate(r'./temp.d...原创 2019-04-01 15:21:30 · 6462 阅读 · 0 评论 -
pandas取出重复数据
drop_duplicates 为我们提供了数据去重的方法,那怎么得到哪些数据有重复呢?实现步骤:1. 采用 drop_duplicates 对数据去两次重,一次将重复数据全部去除(keep=False)记为 data1,另一次将重复数据保留一个(keep=‘first’)记为 data2;2. 求 data1 和 data2 的差集即可:data2.append(data1).drop_d...原创 2019-09-09 18:38:03 · 3926 阅读 · 0 评论 -
windows下用Python把pdf文件转化为图片
不扯没用的,直接上代码1、环境:windows(Linux下应该也没问题)2、python版本:3.63、所需依赖:PyMuPDF(pip install pymupdf)以下是代码# -*- coding: utf-8 -*-"""1、安装库 pip install pymupdf2、直接运行"""import fitz# 打开PDF文件,生成一个对象doc...原创 2019-09-07 16:44:58 · 2359 阅读 · 0 评论 -
python模拟鼠标中轴滚动
需要用到的模块win32api、win32con,安装pywin32即可下载地址:http://download.youkuaiyun.com/detail/clean_water/9759816下面这个方法可模拟鼠标中轴滑动,-1代表页面向下,1代表页面向上。有人说可以指定任意数,还有人反驳说程序只识别正数、负数,正数向上移动一个位置,负数向下移动一个位置,跟值大小没关系。(可能是跟电脑有关系吧)...原创 2019-05-21 09:16:36 · 7800 阅读 · 0 评论 -
批量制作word表格
将excel表中的成绩内容制作为成绩单,每页对应一个学员的成绩,方便打印。原创 2024-07-11 14:05:41 · 615 阅读 · 0 评论 -
批量提取网页表格内容至excel文件
批量提取网页表格内容至excel文件原创 2024-07-11 13:53:16 · 723 阅读 · 0 评论 -
批量提取PDF中表格内容
使用pdfplumber读取PDF文件,自动提取每一页的表格,循环写入新的Excel文件中原创 2024-07-11 10:33:07 · 1327 阅读 · 0 评论 -
批量提取Word文档中表格内容
有一个word文件,其中包含多个格式一致的表格,需要将其内容进行提取,填写到excel中。原创 2024-07-11 10:23:28 · 895 阅读 · 0 评论 -
按模版批量生成定制合同
如果手工来做这个事情,准备好数据之后,需要从Excel表格中复制粘贴数据,再到word中去替换,每次至少需要3分钟的时间。假如每天要开100份,则至少要花5个小时。这样就太浪费人力时间了,而且手工编辑word很容易出错。提前准备好word模板,准备写入word文档的内容,我们使用Python直接读写word模块,通过读取Excel表格中的信息,批量替换内容并生成word文件。一个仪器设备采购公司,商品合同采购需要按模版生成的固定的文件,模板是固定的,只是每次需要替换信息,然后打印出来寄给客户。原创 2024-07-10 16:06:03 · 861 阅读 · 0 评论 -
批量发送定制邮件内容
使用python代码批量给以下学员发送作业反馈邮件原创 2024-07-10 15:11:02 · 407 阅读 · 0 评论