- 博客(88)
- 收藏
- 关注

原创 【工具教程】将PDF批量按页拆分多个PDF文件,提取识别PDF里文字对PDF改名,基于Java的实现操作教程总结
在现代办公环境中,PDF文件因其跨平台、不易篡改的特性被广泛用于文档传输和存储。然而,处理多页PDF文件时,常常需要将其拆分为单页文件以便于管理和分发。此外,根据PDF中的特定文本内容对拆分后的文件进行重命名,可以极大地提高文件检索和管理的效率。通过本项目,用户可以方便地将大型PDF文件拆分为独立的单页文件,并根据每页的内容进行自动化命名,提升工作效率和文件管理的便捷性。
2025-03-26 10:59:32
590

原创 【图片OCR内容改名】如何OCR指定区域图片自动识别内容给图片重命名的实现教程,基于WPF和腾讯云的实现方案
在日常工作和生活场景中,我们常常会接触到大量带有文字信息的图片,例如证件照片、票据图片、带有标识的文档图片等。当需要对大量图片进行管理时,传统的根据拍摄时间或编号命名图片的方式,很难快速准确地定位和区分特定的图片。基于此,开发一个基于WPF界面框架,结合腾讯云OCR服务,实现指定区域图片自动识别内容并给图片重命名的工具就显得尤为实用。它可以帮助各类企业和个人更高效地管理和利用图片资源,提升工作效率。
2025-03-10 16:54:30
885

原创 【图像区域识别改名】JPG的图片和扫描件如何区域识别重命名,并将区域内容保存为表格,基于QT和腾讯API的实现方案
在大型企业或政府机构的档案管理中,有大量的纸质文件被扫描成 JPG 格式保存。这些文件的关键信息(如文件编号、日期、主题等)可能分布在图片的特定区域。通过区域识别重命名,可以将图片文件按照关键信息命名,同时将这些信息保存到表格中,方便后续的检索和管理。以下是基于 QT 和腾讯 API 对 JPG 图片和扫描件进行区域识别重命名,并将区域内容保存为表格的实现方案,包含详细步骤和示例代码。
2025-02-10 14:22:09
286

原创 【PDF图片区域识别】基于WPF实现 PDF 图片区域识别软件:自定义区域识别并保存为表格,详细准备及开发过程
通过以上步骤,我们使用 C# 开发了一个简单的 PDF 图片区域识别软件,允许用户自定义识别区域,识别图片中的文字信息,并将识别结果保存为表格文件。该软件可以根据实际需求进行扩展,如支持多页 PDF 文件、多种语言识别等。
2025-02-08 21:46:48
828
原创 【工具教程】日语竖排图片OCR识别翻译,如何OCR识别图片上竖排的日语?如何将竖排日语转横排日语并翻译,使用教程和注意事项
单击翻译:可以跳转到网页进行翻译,双击窗体就能复制识别后的文本。6、支持对窗体双击内容部分,直接文字复制到别处粘贴。5、支持跳转到搜狗和百度的网页对识别内容翻译。记 录 板:能记录每一次的识别结果一次性导出。7、ctrl+鼠标滚轮,对字体放大缩小。4、从左到右,从右到左的文字顺序切换。9、支持多次识别记录版,简体繁体互转。2、支持对屏幕截图日语竖排的识别。3、拖拽竖排的日语图片进窗体识别。8、支持记录板,多次记录一次导出。1、打开竖排日语图片文件识别。10、支持识别文字百度搜索。
2025-06-08 14:40:38
70
原创 【图片添加不同水印】批量图片添加不同的水印,将文件名批量作为图片水印添加上去,基于WPF的实现方案
摘要:本文介绍了一个基于WPF开发的批量图片水印工具,主要功能包括:1)支持批量添加自定义水印(文字内容、字体样式、颜色、透明度);2)提供9种预设水印位置和自由拖动定位;3)实时预览功能;4)支持JPG/PNG等常见图片格式处理。该工具采用MVVM架构设计,实现异步处理机制避免UI卡顿,并具备配置保存功能。应用场景涵盖版权保护、品牌推广、文档管理等。文章详细解析了核心代码实现,包括水印算法、界面交互和文件处理逻辑,最后提出了多线程优化、模板预设等改进方向。(150字)
2025-06-05 09:56:33
311
原创 【发票识别改名】怎么快速给大量的发票扫描件,以发票号重命名?基于WPF和腾讯OCR识别的解决方案
财务部门每月需要处理大量报销发票,手工整理和命名发票效率低下且容易出错。通过开发一个基于 WPF 和腾讯 OCR 的发票扫描件自动命名工具,可以实现:批量选择发票扫描件图片调用腾讯 OCR 识别发票号码自动以发票号重命名文件保存操作记录便于审计
2025-06-05 09:41:02
314
原创 【工具教程】自动批量识别图片文字并命名,一次性识别多张图片用文字内容改名,基于QT和阿里云api的实现方式
在许多实际工作场景中,我们经常需要处理大量图片文件并根据图片中的文字内容进行命名。例如:文档扫描管理:将扫描的合同、发票、表单等图片按内容自动命名,方便归档和检索教学资料整理:自动识别课件、试卷等图片中的标题或关键词作为文件名电商商品管理:从产品图片中提取型号、规格等信息作为文件名图书馆数字化:对古籍、文献图片进行 OCR 识别并命名医疗影像处理:根据 X 光片、CT 等影像中的患者信息自动命名广告设计流程:从设计稿中提取标题或关键词作为文件名
2025-06-04 12:18:43
410
原创 【图片识别表格】将图片固定区域的内容进行识别,自动提取保存到Excel表格,基于ocr的实现方案
摘要:本文介绍了基于PyQt5和腾讯云OCR的固定区域图片识别系统,该系统能够从发票、试卷、医疗报告等格式图片中提取指定区域信息并输出为Excel表格。系统包含图像区域选择、OCR识别、Excel导出和UI交互四大模块,支持多区域标记、识别结果编辑等功能。文章还提出了性能优化、功能增强和用户体验等方面的改进建议,如批量处理、图像预处理、模板保存等,以提升数据提取效率和准确性。该系统可广泛应用于财务、教育、医疗等需要高效数据录入的场景。
2025-06-04 10:04:38
798
原创 【物流单据识别改名】批量OCR识别京东物流单据用单号区域识别重命名,基于WPF和腾讯OCR识别Api的实现方案
该工具专为物流和电商行业设计,主要用于批量处理京东物流单据。通过集成腾讯云OCR技术,工具能够自动识别物流单号并重命名相关文件,显著提升仓库管理、订单处理和物流跟踪等场景的工作效率,减少人工错误。工具采用WPF界面,分为配置、操作、结果和状态四个区域,支持用户友好地配置OCR参数、选择文件夹、查看识别结果和处理进度。此外,工具还提供了异步处理、进度展示和错误处理等功能,确保操作流畅和程序稳定。未来可进一步优化性能、提高识别准确率,并扩展更多实用功能,以增强用户体验和工具的应用范围。
2025-05-21 23:16:39
310
原创 【日语竖排识别】如何识别竖排日语图片,将竖版的日语图片文字进行识别转横排并且翻译,基于WPF和腾讯OCR的实现方案
竖排日语OCR识别与翻译系统是一款专为处理竖排日文文本设计的工具,适用于学术研究、教育学习、出版行业、文化交流及游戏本地化等多个场景。系统核心功能包括竖排文字识别、竖排转横排文本处理以及多语言翻译,界面设计采用三栏布局,左侧为原始图片预览区,中间显示识别结果,右侧展示翻译结果。系统基于WPF框架和腾讯OCR API实现,包含OCR配置、翻译配置、图像处理结果等数据模型,并通过HTTP请求与腾讯OCR和百度翻译API交互。此外,系统还提供了图像加载、处理、保存及复制到剪贴板等操作,支持用户自定义配置和管理历史
2025-05-19 22:35:14
394
原创 【图片识别工具】如何一次性识别多张图片区域文字改名,或者将多个区域内容组合导出表格,基于WPF和京东OCR的实现方案
本文介绍了一个基于WPF和京东Jd_OCR的批量图片文字识别工具的开发方案。该工具适用于电商商品图片信息提取、文档档案管理、表单数据录入、图片素材重命名等场景。工具界面设计包括顶部菜单栏、左侧文件管理区、中间预览区、右侧配置区和底部状态栏。核心功能通过京东OCR API实现,支持批量处理、区域识别、文件重命名和表格导出。开发步骤包括创建WPF项目、定义数据模型、实现OCR服务类、使用MVVM模式构建ViewModel以及界面XAML设计。旨在打造一个高效办公、易用且功能全面的图片识别处理工具.
2025-05-19 22:28:14
340
原创 【批量查找并复制】一次性查找多个图片文件复制保存到指定位置,多个PDF文件一起查找复制,多个文件批量查找复制剪切删除,基于WPF的实现方案
该工具是一个基于WPF的批量文件处理器,适用于多种文件管理场景,如媒体管理、文档整理和数据迁移。工具支持批量查找、复制、剪切和删除文件,并提供直观的用户界面,包括源目录和目标目录选择、文件类型过滤、文件列表预览和操作按钮。后端代码实现了文件查找、操作和状态更新功能,并通过后台线程处理文件操作以避免UI冻结。工具还支持自定义文件过滤条件和递归查找子目录。优化建议包括添加更详细的进度反馈、错误记录、批量重命名、文件预览、多线程并行处理和历史记录功能。整体设计功能完整,界面友好,性能优化,适合处理大量文件操作。
2025-05-18 13:59:38
247
原创 【照片识别改名】如何批量将图片按图片上多处文字重命名?一次性识别多张图片,用图片多个区域的内容批量改名,基于WPF和阿里云OCR的实现方案
本文介绍了一个基于WPF和阿里云OCR的图片批量重命名工具,适用于电商商品管理、文档整理、图库分类等场景。工具的主要功能包括:文件管理模块支持批量添加图片、显示缩略图和设置保存路径;OCR识别模块允许用户在图片上绘制多个识别区域,并配置阿里云OCR凭证进行识别;命名规则模块提供多种预设规则,支持自定义规则、调整区域顺序及添加时间戳和随机数;批量处理模块显示处理进度,生成预览文件名并执行批量重命名。此外,文章还提出了性能优化、功能增强、用户体验优化和安全优化等方面的建议,以进一步提升工具的效率和实用性。
2025-05-18 10:50:23
407
原创 【软件教程】OCR身份证信息批量识别导出excel,如何ocr识别身份证复印件并导出至excel表格?实现对身份证照片识别获取证件上的信息,并实现批量式获取,导出excel 文档。使用场景及注意事项
文章摘要:本文介绍了身份证信息批量识别软件的应用场景、使用步骤及图片准备注意事项。该软件适用于人力资源管理、客户信息管理、政务服务和档案管理等领域,能有效提高信息录入效率和准确性。使用步骤包括导入图片、识别与导出、图片重命名等操作。在准备身份证图片时,需注意清晰度、完整性、光线条件、平整度、角度和方向以及背景简洁性,以确保识别效果。
2025-05-15 09:52:38
511
原创 【工具教程】批量图片指定区域OCR识别重命名工具,识别图片中内容,根据内容对图片批量重命名,使用场景及注意事项
本文介绍了一款适用于企业文档管理的软件,其主要功能包括批量处理扫描合同、财务票据、员工证件照、快递单号、入库/出库单据、物流标签以及图书档案的图片,并根据关键信息自动重命名。使用步骤包括设定图片模式、批量加载图片、对识别区域进行采样以及批量识别和修改文件名。注意事项涉及图片质量、文件名规范和识别优化建议,如确保图片清晰度、避免特殊字符、统一命名规则、进行预处理和人工复核等,以提高OCR识别准确率和文件管理效率。
2025-05-15 08:02:11
460
原创 【工具教程】批量pdf指定区域OCR识别重命名工具,识别PDF中内容,根据内容对PDF批量重命名,使用场景及注意事项
本文介绍了在不同场景下如何利用PDF处理工具进行批量文件重命名,包括文档管理、物流管理、商品管理以及海关/图书馆等场景。处理步骤包括设定PDF处理模式、批量加载文件、获取识别位置区域以及批量处理PDF识别改名。此外,文章还强调了注意事项,如确保文件质量、遵循命名规范、进行测试与备份以及精确框选识别区域,以确保处理过程的高效性和准确性。这些步骤和注意事项有助于提高文件管理的效率和准确性,适用于需要处理大量PDF文件的各类机构和企业。
2025-05-14 09:29:43
508
原创 【软件工具】根据图片照片某个区域内容批量改名,识别图片中文字内容,根据文字对图片批量重命名和改名,基于WPF和腾讯OCR的识别方案
本文介绍了一种基于WPF和腾讯OCR技术的图片文字识别与批量重命名方案。该方案通过集成腾讯OCR服务,能够自动识别图片中的文字信息,并根据识别结果对文件进行批量重命名,适用于电商商品管理、文档数字化、票据处理和证件管理等多种场景。方案的核心功能包括选择图片文件夹、显示图片列表、OCR文字识别和批量重命名操作。通过封装腾讯OCR服务,实现了对图片的文本识别,并提供了区域选择功能以精确定位识别范围。此外,文章还提出了性能优化、用户体验改进、错误处
2025-05-14 06:32:39
797
原创 教学:如何根据excel的内容批量生成word?如何根据word模板批量根据表格数据生成word文档,基于WPF的实现方式
在实际工作中,经常会遇到需要根据表格中的数据批量生成具有固定格式文档的情况。比如,学校需要根据学生成绩表批量生成每个学生的成绩单;企业需要根据客户信息表批量生成合同、报价单等。借助 WPF 应用程序,用户能够通过直观的界面,将 Excel 表格中的数据与 Word 模板相结合,实现批量生成 Word 文档的功能,从而提高工作效率。
2025-04-16 21:33:42
524
原创 批量图片识别重命名导出表格 — 自动识别图片里的信息来命名文件或导出表格,基于QT和腾讯OCR识别的详细步骤
由于手动实现腾讯云API的签名较为复杂,建议使用腾讯云提供的C++ SDK,或者通过QT调用腾讯云提供的其他语言的SDK(如Python、Java等)来处理OCR请求,再通过进程间通信与QT应用交互。实际应用中,建议使用腾讯云提供的C++ SDK,或者参考腾讯云API签名文档手动生成签名。:批量扫描或导入的文档图片,通过识别文档标题或编号自动重命名,便于管理和检索。在办公自动化系统中高效办公,自动提取图片识别中的关键信息进行分类和命名,提高工作效率。
2025-04-03 13:08:12
861
原创 【PDF文档区域提取】批量PDF文档提取区域内容(电子发票提取明细为案例),将提取出来的内容保存为表格,基于QT的解决方案
通过以上步骤,我们开发了一个基于 QT 的应用程序,实现了批量 PDF 文档区域内容提取,并将提取的内容保存为表格。在开发过程中,我们使用了 QT 的界面设计功能、文件对话框、信号和槽机制等,以及 Poppler-Qt5 库来处理 PDF 文档。同时,通过日志文本框和进度条,用户可以实时了解提取过程的信息和进度。需要注意的是,本示例中的内容提取规则是简单的正则表达式匹配,实际应用中可能需要根据电子发票的具体格式进行更复杂的规则调整。
2025-03-13 11:14:54
832
原创 【图片转PDF】怎样批量将多个图片转成PDF,多个文件夹一次性转换,基于QT语言的详细解决方案
通过以上步骤,我们成功开发了一个基于 QT 语言的图片批量转换为 PDF 的应用程序。该应用程序具有简单易用的界面,能够一次性处理多个文件夹中的图片,并将其转换为 PDF 文件。在开发过程中,我们使用了 QT 的文件对话框、布局管理器、信号和槽机制等功能,实现了用户交互和文件处理的功能。同时,通过日志文本框,用户可以实时了解转换过程中的信息。需要注意的是,该应用程序只支持.jpg.jpeg和.png格式的图片文件。如果需要支持其他格式的图片文件,可以在代码中修改entryList函数的参数。
2025-03-13 11:07:05
606
原创 【批图片识别改名】自动识别图片文字并命名,一次性识别多张图片将图片内容作为文件名,基于QT语言和阿里云的实现方案
在日常工作和生活中,我们可能会遇到大量图片,这些图片包含文字信息,但文件名可能是随机生成的,不利于管理和查找。例如,扫描文档、拍摄的笔记等。通过自动识别图片中的文字,并将识别结果作为图片的文件名,可以提高图片管理的效率,方便后续的查找和使用。通过以上步骤,你可以实现一个基于 QT 和阿里云 OCR 的图片文字识别重命名工具。
2025-03-12 12:37:36
419
原创 【手机号码归属地批量查询】如何通过excel快速查看号码归属地,WPS表格查询手机号码归属地,我们今天基于WPF的查询方案来完成
在很多业务场景中,我们可能需要对大量的手机号码进行归属地查询。通过开发一个 WPF(Windows Presentation Foundation)应用程序来实现手机号码批量查询归属地的功能,可以提高工作效率,方便用户快速获取手机号码的归属地信息。键运行项目,在输入框中输入手机号码,点击 “查询” 按钮,即可在结果框中看到查询结果。中设计界面,包含一个文本框用于输入手机号码(每个号码占一行),一个按钮用于触发查询操作,以及一个文本框用于显示查询结果。为了实现手机号码归属地查询功能,我们可以使用。
2025-03-12 12:24:27
636
原创 利用 WPF 和阿里云实现图片多区域文字识别并保存至 Excel
本项目旨在通过自定义指定图片的多个识别区域,利用强大的文字识别技术将这些区域内的文字提取出来,并保存到 Excel 表格中,方便后续的数据处理和分析。我们选择使用 WPF(Windows Presentation Foundation)作为前端开发框架,以提供友好的用户界面,方便用户自定义识别区域。同时,借助阿里云的文字识别服务,利用其先进的 OCR(Optical Character Recognition)技术,实现高精度的文字识别功能。
2025-03-10 16:24:49
974
原创 【PDF识别重命名】如何识别PDF区域内容对文件进行改名处理或将内容导出表格,基于C++的完整解决方案
大型物流公司每天都会收到大量来自不同供应商的货物运单 PDF 文件。这些运单包含了货物的详细信息,如发货人、收货人、货物名称、运输单号等。为了方便管理和后续的数据统计分析,物流公司需要对这些 PDF 运单进行处理,具体需求如下:1、从每个 PDF 运单中提取运输单号作为文件名,对文件进行重命名,以便于快速定位和查找特定运单。2、将所有运单中的关键信息(如发货人、收货人、货物名称、运输单号)导出到一个 Excel 表格中,方便进行数据统计和分析。
2025-02-15 08:00:39
583
原创 【PDF自动化处理】怎样利用WPF结合百度API快速识别PDF指定多个多区域内容并导出到Excel表格文件,详细代码及步骤
准备工作:注册百度 AI 开放平台账号,创建文字识别应用,获取 API Key 和 Secret Key;创建 WPF 项目,安装必要的 NuGet 包。处理 PDF 文件:使用Spire.PDF库读取 PDF 文件,并截取指定区域的图像。调用百度 API 进行文字识别:使用HttpClient发送 HTTP 请求到百度 API,获取识别结果。导出到 Excel 文件:使用库将识别结果保存到 Excel 文件中。
2025-02-09 13:16:02
1030
原创 【自动化办公】如何快速的去识别PDF多个区域内容,将内容提取出来后保存到Excel表格里面,基于WPF的和腾讯API的详细解决方案
以下是一个基于 WPF 和腾讯云 OCR API,快速识别 PDF 多个区域内容并将其提取保存到 Excel 表格的详细解决方案,包含应用场景和代码示例。
2025-02-09 13:10:49
1047
原创 【PDF区域识别】批量提取PDF指定区域内容对文件重命名,基于WPF的离线识别详细步骤和方案
在 “解决方案资源管理器” 中,右键单击项目名称,选择 “管理 NuGet 包”,搜索。打开 Visual Studio,创建一个新的 WPF 应用程序项目。为了处理 PDF 文件,我们将使用。
2025-02-08 06:16:20
322
原创 【图纸识别信息到表格】批量识别图纸区域的内容导出到Excel表格,很难吗,下面教你实现方案,基于C++和腾讯Api的实现方案
有许多PDF图纸,需要提取所有页面中每一页(如下图实例图片的黄色区域)的指定区域信息到EXCEL中,大量图纸就没办法操作嘞!在许多工程、设计和文档处理场景中,图纸包含了大量有价值的信息。然而,手动从图纸中提取信息并录入到 Excel 表格中是一项繁琐且容易出错的工作,效率极低。
2025-02-07 10:28:26
286
原创 【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字,并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个
在很多实际工作场景中,我们可能会遇到大量的图片文件,这些图片中包含特定区域的文字信息,比如发票图片上的发票号码、合同图片上的合同编号等。使用自动批量识别 JPG 图片上的区域文字,并直接提取文字为图片命名的软件,可以大大提高工作效率,减少人工操作带来的错误。编译并运行程序,点击 “选择图片文件夹” 按钮,选择包含 JPG 图片的文件夹,程序将自动对图片进行 OCR 识别,并根据识别结果重命名图片。替换为你在腾讯云控制台获取的实际 SecretId 和 SecretKey。
2025-02-07 10:18:00
409
原创 【图片和PDF局部文字】批量图片区域识别+修改文件和导出表格,基于Go和飞桨的解决方案
飞桨提供了许多预训练的图像识别模型,如 PaddleClas 中的 ResNet、MobileNet 等。你可以根据具体的识别任务选择合适的模型。在工业生产流水线上,可能会有大量的零部件图片,每个零部件图片上都有特定区域标注着型号、批次等信息。通过批量图片区域识别,可以快速提取这些关键信息,然后根据业务需求修改文件名(例如将识别到的型号作为文件名的一部分),最后将识别结果整理成表格用于生产管理、质量追溯等工作。通过以上步骤,你可以实现批量图片区域识别、文件名修改和表格导出的功能。将上述 Go 代码保存为。
2025-02-06 10:34:57
1045
原创 【扫描件PDF识别】扫描件的PDF快速提取中间的内容导出表格,基于Python和华为API的解决方案
要实现从扫描件的 PDF 中快速提取中间的内容并导出表格,可以借助华为云的文字识别 API。在许多实际工作场景中,我们经常会遇到需要从扫描件的 PDF 文件中提取特定内容并整理成表格的需求。
2025-02-06 10:28:33
275
原创 【PDF精准区域提取】提高基于阿里云API的图片型PDF区域识别内容的准确性?快速精准识别区域文字,基于QT和阿里云的扫描件的PDF识别处理方案
医院的病历、检查报告等可能以图片型 PDF 形式存在。通过识别这些文件中的文字信息,如诊断结果、药品名称等,保存到表格,便于病历管理和医疗数据统计。:政府部门处理各种公文、档案扫描件,利用此功能可以将文件中的重要内容提取出来,整理成表格,提高信息检索和利用效率。打开 QT Creator,创建一个新的 QT Widgets Application 项目。在众多业务场景中,图片型 PDF 的处理需求十分常见。对象,显示主窗口并启动应用程序。
2025-02-05 09:43:36
453
原创 【PDF提取表格】图片型PDF区域识别内容保存表格,基于QT和腾讯API的实现
我们需要从这些图片型 PDF 文件中提取特定区域的文本信息,并将其保存到表格中,以便进行后续的数据分析、存档等操作。基于 QT 和腾讯 API 的实现方案可以方便地开发出具有图形界面的应用程序,利用腾讯强大的 OCR(光学字符识别)能力,高效准确地完成文本提取和表格保存的任务。在很多实际工作场景中,我们可能会遇到图片型的 PDF 文件,这些文件中的文本信息无法直接复制和编辑。通过以上步骤和代码,你可以实现一个基于 QT 和腾讯 API 的图片型 PDF 区域识别内容保存表格的应用程序。
2025-02-05 09:33:20
455
原创 【PDF提取内容到表格】扫描的PDF如何快批量速提取里面的局部区域内容导出到Excel表格,基于WPF和飞桨的详细步骤
收集不同类型(如 X 光、CT、MRI 等)的射线报告 PDF 文件。这些报告可能来自不同的设备和科室,格式和布局存在差异。:对于每张报告,确定需要提取信息的关键区域,如患者基本信息(姓名、年龄、性别等)、检查部位、检查所见、诊断意见等。使用图像标注工具(如 LabelImg 等)标注出这些区域在 PDF 页面中的位置(坐标)。这一步骤有助于后续准确裁剪图像。
2025-02-04 11:33:53
858
原创 【PDF提取表格】如何批量拆分PDF、如何在PDF中批量提取表格Excel?基于Python的解决方案
PDF文件里存在各式各样的表格,招标文件里的工程量清单表,公路图纸里的工程量表,化工管道材料表,还有各式各样的工程材料表,设备表格等。把表格数据提取到excel里,方便对数据进行汇总整理、计算统计。要使用 Python 在 PDF 中批量提取表格并保存为 Excel 文件,可以借助tabula-py库。tabula-py是一个用于从 PDF 文件中提取表格数据的 Python 库,它基于 Java 的 Tabula 项目。
2025-02-04 10:20:01
410
原创 【图片水印识别分类】利用图片水印文字信息实现图片分类与文件夹转移,基于Java和阿里云的解决方案
大型广告设计公司每天都会产生大量的设计图片,这些图片包含各种不同的项目信息和版权标识(即水印文字)。为了方便后续的查找、使用和管理,需要对图片进行分类整理。以下是一个基于 Java 和阿里云 OCR 服务,利用图片水印文字信息实现图片分类与文件夹转移的解决方案,包含详细步骤、代码示例和相关解释。
2025-02-03 07:15:42
447
原创 【识别图片保存表格】自定义指定图片多个识别区域,识别文字并保存到Excel中,Python+阿里云api的解决方案
在企业的法务部门或商务部门,经常需要处理大量的合同文件。合同中的关键信息(如合同编号、签约日期、双方名称、金额等)通常分布在固定的区域。可以利用上述代码自定义指定图片多个识别区域,精确提取这些关键信息。以下是使用阿里云 OCR 服务实现自定义指定图片多个识别区域,识别文字并保存到 Excel 中的方案,包含代码实现和应用场景介绍。
2025-02-03 07:02:23
316
原创 【识别图片保存表格】自定义指定图片多个识别区域,识别文字并保存到Excel中,Python+api的解决方案
在电商运营或商品管理中,需要从商品标签图片中提取商品名称、规格、价格等信息。商品标签的布局通常是固定的,不同信息位于特定的位置,可以利用代码自定义识别区域来采集这些信息。你需要在百度智能云平台创建一个 OCR 应用,获取。用于调用百度 OCR API,用于处理 Excel 文件,
2025-02-03 06:57:51
445
批量创建文件夹,并把图片移动到子文件夹里
2025-03-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人