最近在做一个解析PDF解析成纯文本相关的功能,客户提供的PDF的编码是GBKp-EUC-H,用pdfbox这个来解析的话始终会报编码不能识别的错误,后来找到了PDFile TeT这个工具,但是不知怎么用,有高手来指点一下吗,今天为了这个给老板骂了一通 :cry:
关于用PDFile TeT解析PDF的用法
最新推荐文章于 2021-09-08 22:27:36 发布
本文讨论了使用PDFBox处理特定编码(GBKp-EUC-H)的PDF文件遇到的问题,并尝试寻找替代工具PDFileTeT来解决该问题。
7万+

被折叠的 条评论
为什么被折叠?



