从word、wps、excel、pdf和txt文件中查找文本的工具。
因工作中要经常从大量word文档中查找固定的文本,所以自己就做了本工具。
可以批量从doc、docx、wps、xls、xlsx、pdf(需要开源pdfium.dll支持,已放在包里)和txt文件中查找关键文本。
doc、docx和wps文件采用OLE方式读取,所以系统中需要安装word及wps软件,xls和xlsx是直接读取,可以不安装excel。
查找的文本可以是多个,用英文逗号分隔(逗号相当与或者的关系),也可以在已有列表中查找(可以实现并且的关系)。
找到的列表支持导入导出。
本工具使用delphi10.4编写,因使用FMX,文件较大(12M多),所以用UPX压缩到3M。
本人使用的系统环境为:win10,office2016、wps2019,没有多余的环境可测试,若发现问题,可在本贴反馈,我找时间修改完善。
4月18日更新至1.5版本
新增功能
1.增加搜索文件过滤:按文件大小,按文件修改日期
2.增加区分大小写选项
3.增加搜索目录历史记录,查找文本历史记录,搜索目录允许编辑(双击可以删除历史记录),记录保存在与程序相同目录相同文件名的ini文件中,可以编辑和删除。
4.增加对处理失败文件的统计和查看(无可避免的会有处理不了的文件,比如:对有些非标准的文件、带有密码的文件无法处理)
修复功能
1.对除ansi格式以外的文本文件的支持ansi,utf8,utf16,Unicode都能正确查找(上一个版本只能处理ansi的)
2.修复处理过程中遇到错误就停止,不能全部处理的问题
3.修复ole初始化错误的问题
4.修复对本来是xlsx文件,但扩展名是xls的文件的处理错误问题(通过对文件头的判断识别xls还是xlsx文件,上版只是简单的通过扩展名判断)
5.其他细节上的修复。
目前发现无法解决的问题
对不是通过excel或wps(ET)创建的非标准xlsx文件的兼容性存在问题。(对这类文件,只要通过excel或wps打开后再保存一次就可以正确处理,后面考虑对这类文件通过ole来处理,虽然速度会降低)
5月1日更新1.6版本
1.新增可以同时搜索多个目录,
2.新增可以自定义文本文件扩展名(如:pas,ini,c,h等以文本形式存储的文件,如果不是文本文件格式可能会出错)
3.可以使用通配符(*,?)对将搜索的文件名加以限制(如“*管理”,只搜索文件名是“文件管理”“图片资源管理”等文件)
4.增加按创建时间搜索的选项,列表内容也增加文件创建时间。
5.改变了文件大小获取的方式,可以增加速度,特别是大文件比较明显。
6.界面方面的调整和其他小问题的修复。
7.窗口标题增加“吾爱破解”的标识。
5月1日1.6版
下载地址:《从word、wps、excel、pdf和txt文件中查找文本的工具》