PDF文字拷贝问题解决思路

有时候我需要把PDF中的文字拷贝出来,比如拷贝到txt文本中。这个时候呢,一般情况我会用adobe writer pro打开这个文档,直接选中复制好了,这个时候我又一次碰到一个问题,不是密码保护问题,是pdf字体的问题,我系统中并没有pdf文档中的那些字体,我拷贝出来复制到文本中的全成了乱码。
那就去下载字体咯,可我也不知道该下载什么字体,真倒霉!
这儿时候我就应该切换下思路,用orc软件扫描pdf,生成txt文件,也许pdf本身不够清晰的话,会有很多错误,可至少这种方法很实用!一般来说,orc软件识别不了的,那么adobe writer pro打开肯定也复制不了,因为它基本上不是那种文字形式的,是扫描的图片形式。我推荐用汉王文本王7600,这个软件40M左右,很多地方可以下载到。

首先,用adobe writer pro打开pdf文件,点击 文件 --》 另存为 --》 ***.jpg,这一步是把pdf文件另存成图片形式,好让orc软件可以去扫描。其次,用orc软件打开图片进行识别然后导出成.txt、.doc等

就这么简单!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值