自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 GPTPDF本地部署

GPTPDF 是一个轻量级但功能强大的 PDF 内容结构化提取工具。它结合 PyMuPDF 与 GPT-4o,能够高保真地将学术论文、扫描文件、图文混排材料等解析为标准 Markdown 格式,包括图表、数学公式、表格与结构化段落。

2025-07-10 16:55:54 1126

原创 OCRFlux本地部署

OCRFlux是一款基于多模态大语言模型的PDF/图像转Markdown工具,具有以下核心优势:1) 支持整个文件解析和页面级处理,包括多栏布局、表格、数学公式识别;2)首创跨页合并功能,保持表格和段落的连贯性;3)在EDS指标上显著优于主流OCR模型。本地部署需安装poppler-utils依赖,通过ModelScope下载3B参数模型,在RTX 3090等GPU上即可运行。测试显示其能将复杂PDF准确转换为结构化Markdown文本,项目提供在线Demo和开源代码。

2025-07-07 12:47:27 2301 3

原创 Docling本地部署

Docling是一款支持多格式文档解析的AI工具,提供PDF理解、OCR识别和统一文档表示等功能。它支持PDF、Word、Excel等常见格式,以及音频和图像文件处理,并能导出为Markdown、HTML等格式。Docling强调本地化部署,保障数据安全,同时集成LangChain等AI框架,便于开发。未来将新增元数据提取、图表和化学结构识别功能。部署时需安装docling和modelscope库,下载模型文件后即可通过Python代码调用,实现文档解析与转换。该工具适合需要处理复杂文档的企业和个人开发者。

2025-07-03 16:10:52 1693 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除