今天分享一个真实的Python自动化办公实战案例。近几年开始,大学里的团支书便多了一项任务——催收青年大学习截图。一天天的太卑微了,班级几十个人,一个个收集整理起来超麻烦,收集完截图后还需要改名字,填充到Excel中提交给老师。真的繁琐又心累…
对于这种重复性任务,能不能用Python帮帮忙呢?
如下图所示,左侧是存在本地文件夹中的班级每个同学的青年大学习截图,但是没有标注名字。右侧是班级同学的名单,后续需要将对应的同学截图插入到Excel表格的B列中。
接下来我们开始详细学习如何解决这个Python自动化办公需求。首先调用百度API需要安装一个库,如下所示。
pip install baidu_aip
接着使用百度API搭建自定义函数,实现对任一截图进行文字OCR识别。
在交互式环境中输入如下命令:
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_words_result(filePath):
image = open(filePath, 'rb')
text_list = client.general(image.read())
texts = ""
for i in range(16):
texts += text_list['words_result'][i]['words']
image.close()
return texts
Python调用自定义的get_words_result()
函数,文字识别青年大学习截图,执行效果如下图所示。
截图中的文字都识别出来了,但怎么确定这个截图属于哪位同学呢?观察上图左侧,原截图中其实有两个字段是唯一的:姓名、用户编号。
还记得有一张“学生名单”的用户表嘛,所以我们可以遍历表格中的姓名列,判断该姓名是否存在于刚刚识别出来的文字字符串中。若存在,则证明该截图属于A同学,接着使用os.rename()
方法将截图重命名为A同学.png
,最后再将截图插入到Excel表格中对应的A同学后面。
这一步插入图片使用的是,openpyxl模块中的sheet.add_image()
方法
在交互式环境中输入如下命令:
wb = load_workbook("学生名单.xlsx")
sheet = wb.active
filenames = os.listdir("./截图")
for i in filenames:
time.sleep(1)
texts = get_words_result(f"./截图/{i}")
for row in sheet:
student_name = row[0].value
row_name = row[0].row
if student_name in texts:
os.rename(f"./截图/{i}", f"./截图/{student_name}.png")
sheet.row_dimensions[row_name].height = 54
img = Image(f"./截图/{student_name}.png")
width, height = img_resize(img.width, img.height)
img.width, img.height = width, height
sheet.add_image(img, f'B{row_name}')
在上述代码中,在add_image()
插入图片前还有4行Python代码。这是为了保证截图插入表格中与单元格相贴合,所以既设置了单元格的行高,也重置了截图的长宽。
具体输出结果所下图所示:
所上图所示,班级每个同学的青年大学习截图,都重新标注了名字,而且也对应的插入到Excel表格的B列中了。
更多Python学习资料请戳👇