Pandoc 是一款强大的文档转换工具,支持 40+ 种文档格式 的相互转换,Python 可通过 pypandoc 库调用 Pandoc 功能。以下是 Pandoc 支持的主要文档转换功能分类及实例代码(需先安装 Pandoc 和 pypandoc):
一、安装依赖
-
安装 Pandoc 工具:
- 官网下载:https://pandoc.org/installing.html
- 或通过包管理器:
sudo apt install pandoc(Linux)、brew install pandoc(macOS)。
-
安装 Python 库:
pip install pypandoc
二、主要转换功能及实例代码
以下是最常用的转换场景,涵盖 标记语言、办公文档、网页格式、电子书 等类型:
1. 标记语言 ↔ 网页格式
(1)Markdown → HTML
import pypandoc
# 从文件转换
output = pypandoc.convert_file(
'input.md', # 输入Markdown文件
'html', # 输出格式
outputfile='output.html' # 输出文件
)
# 从文本转换
md_text = '# 标题\n\n这是一段**粗体**文本'
html_text = pypandoc.convert_text(md_text, 'html', format='md')
print(html_text) # 输出:<h1 id="标题">标题</h1>\n<p>这

最低0.47元/天 解锁文章
1389

被折叠的 条评论
为什么被折叠?



