DITA-OT是DITA Open Toolkit的缩写,它是一个开源发布引擎,用于将DITA格式的内容发布成不同格式的输出,比如:HTML、PDF等。
有些结构化编辑系统(如:Oxygen XML Editor)已经集成了DITA-OT。如果选择DITA来编写结构化内容,那么你很有可能已经通过DITA-OT进行内容发布了。
下边我们一起来看看DITA-OT是怎样工作的。
- 1 -
DITA-OT发布PDF的过程
以下是使用DITA-OT发布PDF的命令:
dita -i cloudphoto.ditamap -f pdf -o pdfout
它的意思是:
-
输入文件为cloudphoto.ditamap文件;
-
输出格式是pdf;
-
输出结果放到pdfout目录中。
运行这个命令,后台发生什么事情呢?下边我们一起来看一下。
DITA-OT支持发布多种格式的输出,主要分为PDF和基于HTML的输出两类。下图中,蓝色路径是运行发布PDF命令后走过的步骤。

1. 通用预处理
不论发布的类型是什么,DITA-OT发布首先运行的是预处理程序。它主要是为后续的步骤做准备工作。根据DITA-OT的文档,预处理包括:生成列表、处理引用、内容过滤、移动元数据等17个模块,详情请见DITA-OT文档:
https://www.dita-ot.org/dev/reference/preprocessing.html
2. 合并Topic
DITA数据包通常由一个ditamap和多个topic文件组成。为了方便处理,DITA-OT将这些内容合并到一个XML文件中。
3. 将XML转换成XSL-FO

XSLT是一个数据转换的语言,由XSLT引擎执行。它通过读取XML文件,应用数据处理逻辑,然后生成XSL-FO文件。
4. 将XSL-FO转换成PDF

XSL-FO是W3C的标准之一,用于XML文档的布局和打印。要将XSL-FO生成PDF,需要用到FO引擎。
DITA-OT目前支持三个引擎,他们分别是:
-
FOP - 开源的FO引擎,已经包含在DITA-OT中;
-
Antenna House - 商业FO引擎,DITA-OT可以使用它发布PDF,但需要单独购买和安装;
-
RenderX - 商业FO引擎,DITA-OT使用它发布PDF,也需要单独购买和安装。

本文详细介绍了如何使用DITA-OT发布PDF,并着重讨论了如何处理中文内容,包括内容标识、中文字体安装及字体映射配置。
最低0.47元/天 解锁文章
1303

被折叠的 条评论
为什么被折叠?



