PDF在创作完成后,生成的第一个版本,一般采用的是全新写方式,也就是所有的描述元素在前面,交叉索引表放在最后,当然还有另一种情况,PDF按线性化进行保存,这样的文档通常有两个交叉索引表,文档之初就有一个交叉索引表,文档最后有一个交叉索引表。
要进行PDF文档版本还原,就只需要从后往前找到交叉索引表的位置末端的位置,再从文件头开始读取,就可以得到前面的文档版本。搞得好像PDF本身就有版本管理似的。
其实,PDF文档在修改到一定程度,PDF编辑器就应该按全新写的方式,进行文档保存,原因是:运行效率、文件大小。
今天有个网友问起版本还原的问题,以前还真没有意识到,故而写下来,增强记忆。
本文探讨了如何利用PDF的增量写特性来还原其迭代版本。通过从文件末尾找到交叉索引表的位置,再从文件头部读取,可以获取早期的文档版本。这种方法揭示了PDF在一定程度修改后,编辑器应采取全新写方式保存,以提高效率并减小文件大小。
2285





