PDF格式中,一些通用数据结构是根据基本对象类型构建的,并且在整个PDF中的许多地方都使用。本章节会介绍文本字符串,日期,矩形,名称树和数字树的数据结构。
String Object Types 字符串对象类型
PDF 字符串对象根据具体的功能作用可以分为:文本字符串,PDFDocEncoded字符串,ASCII字符串或字节字符串。主要通过表示字符串描述的字符或字形的编码进行区分。
字符串对象类型如下表:
| 类型 | 描述 |
|---|---|
| text string | 应用于人工可读的文本,例如文本注释,书签名称,文章名称和文档信息。 这些字符串应使用PDFDocEncoding或带有前导字节顺序标记的UTF-16BE进行编码。 |
| PDFDocEncoded string | 用于单个字节中表示的字符和字形。 |
| ASCII string | 用于使用ASCII编码在单个字节中表示的字符。 |
| byte string |
本文介绍了PDF格式中的通用数据结构,包括文本字符串、PDFDocEncoding字符集、二进制字符串、文本流、日期、矩形、名称树和数字树。详细阐述了各结构的用途、编码方式及特点,如文本字符串的PDFDocEncoding与Unicode转换,日期的ASN.1标准,以及名称树和数字树的结构和应用。
订阅专栏 解锁全文
4073

被折叠的 条评论
为什么被折叠?



