PDF全文翻译

作者因阅读英文论文遇到困难,使用Python开发了一个PDF全文翻译工具,利用PyMuPdf提取PDF文字并调用google翻译实现全文翻译,特别针对图表和公式进行了优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近看论文实在是头大,花了一点时间用Python写了个小工具,实现了PDF的全文翻译(得意的笑)。试过其他的一些PDF翻译的方法,感觉不是很理想,来对比一下:

某狗:
某狗
某君:
某君
Python完成的效果:
Python完成的效果

(某狗的是旧版本的论文,和我本机测试的略有不同),但还是可以看出效果,差强人意,专门对图表和公式进行了一些设置,其他的一些细节就没注意了,和某狗对比一下:

Python完成的效果:
Python完成的效果
某狗:
某狗
本人是win 64位,把代码打包了一下,同样是win 64位的朋友应该可以用。

下载地址:
百度网盘
蓝奏云​

原理

很简单,主要是站在了巨人的肩膀上。

  1. 调用PyMuPdf提取PDF里的文字,判断是不是正文。
  2. 调用google翻译,获取中文翻译。

因此对正文的判断有些问题,可能仍会有公式和表格乱码。PyMuPdf提取的文字字体和字号也有些问题,等有时间再弄吧,喜欢的话微信扫一扫给我打赏吧。

在这里插入图片描述

评论 41
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值