版权声明:本文为博主原创文章,转载 请注明出处:https://blog.youkuaiyun.com/sc2079/article/details/106246106
-写在前面
最近想提升自己的PPT制作能力,便下载了某PPT教程类微信公共号的html文档,非常多,感觉一篇篇挨着看效率不高。因此,有了分类整理并制作PDF文档的想法。
- 环境配置安装
运行环境:Python3.6、Spyder;
依赖模块:pdfkit、PyPDF2等。
注:pdfkit的安装可以参考: python将html转化为pdf
- 开始工作
1.读取目录
首先,要有待整理文档的分类目录,示例如下:
我采用字典存储目录。
#读取txt文档目录
def read_txt(file):
contents={
}
with open (file,'r') as f:
for line in f.readlines():
if line!='\n':
line=line.replace('\n','')
if re.search('^[0-9]+\.',line):
content=[]
contents[line]=content
continue
else:
line=line.replace('? ','')
content.append(line)
可以根据自己的目录特点加以修改。根据目录整理文档
2. 根据目录将html文档分类复制到指定位置
def copy_file(file_from_path,file_to_path,contents):
if os.path.isdir(file_from_path):
old_files=os.listdir(file_from_path)
tt=findStr(old_files[0],'_',2)+1
_old_files=[]
for old_file in old_files:
_old_file=old_file[tt: