使用场景
用户有大量PDF文件(扫描PDF文件或可选文字PDF文件),期望能将PDF按页拆分为多个PDF文件,然后再按照PDF中的某些文字对PDF文件批量重命名、改名。期望工具可以批量处理、离线识别(保证数据安全性),手工操作麻烦且容易出错。具体场景:用户有订单、合同、简历、图纸等PDF文件,期望将PDF按页拆分多个文件,并批量重命名、改名,后期对文件进行快速检索 ,不用每个文件打开看。
工具处理
第一步:选择要拆分并重命名的PDF文件,设置按页拆分PDF
选择待改名的PDF文件,可按照文件夹选择,也可按文件选择。支持按指定范围页导入,可设置图片精度(适当调整精度可提高识别率)。按页拆分PDF文件,设置导出路径。
导入后软件主界面,左侧导入文件列表,中间图片预览,右侧识别结果预览。也可对图片旋转、文件排序、设置PDF精度等。
第二步:设置要识别的区域(可设置多个)
在识别范围窗体里,添加需要识别的范围(按住鼠标拉框绘制识别区域),通过同步范围设置把当前图片的识别区域同步到其他图片上。识别范围可保存为模板,后续直接加载复用。
第三步:对识别范围进行批量识别文字
执行批量识别,识别结果淡绿色,右侧识别结果文字,可以校核与编辑。识别结果有误的,右侧结果列表可用替换、编辑、提取等功能进行修改。在图片区域选中识别范围框,识别结果列表窗体会自动定位识别结果。
第四步:选择自定义区域,对PDF改名
选择指定的识别区域,根据识别结果最终改名。文件改名预览窗体里,可以校核与编辑新的文件名,校核无误之后,确定即可。如果要修改原始PDF的文件名,勾选左上角的“同步修改原始PDF文件”。
至此,通过以上步骤就能PDF按页拆分文件,并按照指定识别区域文字,批量PDF改名、重命名。