深入了解PDF文件结构与绘图操作
1. PDF文件基础结构
PDF文件是由8位字节序列组成,这些字节被分组为以空白分隔的标记。它可以仅使用可读ASCII字符集创建,也可包含不可读的二进制数据,如图片或压缩数据,但所有关键字标记都以可读的ASCII字符呈现。与PostScript文件不同,不能直接用文本编辑器创建PDF文件,因为它依赖一个交叉引用表,该表是文件的逐字节索引。创建或修改PDF文件需要借助能跟踪文档结构并更新文档内对象位置的工具。
一个简单的PDF文件由四个部分构成:
- 头部(Header) :包含文件结构的相关信息。
- 主体(Body) :包含描述文档页面的对象序列。
- 交叉引用表(XREF Table) :作为文档所有对象的索引。
- 尾部(Trailer) :包含文件结构的相关信息。
文档中的所有标记由任意空白(如一个或多个空格、换行符、制表符或回车符)分隔。以下是PDF文件结构的简单图示:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(Document):::process --> B(Header):::process
A --> C(Body):::process
A --> D(Cross reference table):::p
超级会员免费看
订阅专栏 解锁全文
635

被折叠的 条评论
为什么被折叠?



