- 博客(1)
- 问答 (4)
- 收藏
- 关注
原创 python批量docx to pdf
最近在使用MinerU将PDF文件转为Markdown格式,MinerU转换的过程中会自动的将PDF文段行尾的换行符或者空格等干扰项去除,同时还保留了文章的层级信息,是一个非常好用的工具。但是,通常还会遇到许多的Word文档(doc、docx),现在的MinerU已经不在内部集成libreoffice了,这就需要我们自己处理Word文档,将它们转换为PDF文档再给MinerU处理。
2025-06-18 18:31:08
293
空空如也
spacesniffer[C盘清理]
2023-03-21
idea连接MySQL失败
2023-02-21
Python中关于复数的问题
2021-12-03
能看看👀哪里出了错,要怎么改才能正常输出
2021-11-06
能告诉我是哪里错了吗?[已经排除了中文符号的可能]
2021-11-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅