- 博客(3)
- 收藏
- 关注
原创 GPTPDF本地部署
GPTPDF 是一个轻量级但功能强大的 PDF 内容结构化提取工具。它结合 PyMuPDF 与 GPT-4o,能够高保真地将学术论文、扫描文件、图文混排材料等解析为标准 Markdown 格式,包括图表、数学公式、表格与结构化段落。
2025-07-10 16:55:54
1126
原创 OCRFlux本地部署
OCRFlux是一款基于多模态大语言模型的PDF/图像转Markdown工具,具有以下核心优势:1) 支持整个文件解析和页面级处理,包括多栏布局、表格、数学公式识别;2)首创跨页合并功能,保持表格和段落的连贯性;3)在EDS指标上显著优于主流OCR模型。本地部署需安装poppler-utils依赖,通过ModelScope下载3B参数模型,在RTX 3090等GPU上即可运行。测试显示其能将复杂PDF准确转换为结构化Markdown文本,项目提供在线Demo和开源代码。
2025-07-07 12:47:27
2301
3
原创 Docling本地部署
Docling是一款支持多格式文档解析的AI工具,提供PDF理解、OCR识别和统一文档表示等功能。它支持PDF、Word、Excel等常见格式,以及音频和图像文件处理,并能导出为Markdown、HTML等格式。Docling强调本地化部署,保障数据安全,同时集成LangChain等AI框架,便于开发。未来将新增元数据提取、图表和化学结构识别功能。部署时需安装docling和modelscope库,下载模型文件后即可通过Python代码调用,实现文档解析与转换。该工具适合需要处理复杂文档的企业和个人开发者。
2025-07-03 16:10:52
1693
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅