Linux下用bash写一个英译汉的pdf viewer的插件

本文介绍了如何使用Python的OCR技术从图片中提取英文文字,并通过一系列命令实现自动化处理,包括安装必要的OCR工具、截取指定区域、识别文字并判断区域是否为空白。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用到的命令有:

  xdotool getmouselocation # 用来获取鼠标位置

  import -window root -crop <x>x<y>[+-]<X>[+-]<Y> -quality 100 # crop后的为截屏的区域大小(分辨率),和原点的位置(X,Y)

  sudo yaourt -S tesseract tesseract-data-eng  # 安装OCR命令tesseract和英语训练数据data-eng, 简体中文为chi_sim

  tesseract test.png test -l eng # 按英语的识别模式来识别test.png中的文字,将结果保存在名为test后缀为.txt的文件中

  identity -verbose test.png | grep "mean:" # 获取test.png的平均灰度值,用来判断该区域是否为空白, 如果mean的值为255,说明为空白。


  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值