批量抓取csdn博客列表文章,简化后转为pdf保存
标签:blog python
简介
这是一个简单的python脚本。目前实现的功能只能将某个指定csdn博客的所有博文精简网页后,只保留标题和内容,然后转为pdf,以博文标题为名称保存在本地。
UPDATE
新版本支持代码高亮插件。
[TODO]
- 添加更多博客支持
- 添加更多格式(如markdown)支持
- 改善字体问题
USAGE
需要安装这些python模块:
BeautifulSoup
pip install BeautifulSoup
需要安装这些软件:
wkhtmltopdf
sudo apt-get install wkhtmltopdf
介绍了一个简易Python脚本,能批量抓取指定优快云博客的文章,并简化页面仅保留标题与内容,再转换成PDF文件保存。新版本已支持代码高亮。
1万+

被折叠的 条评论
为什么被折叠?



