MinerU容器构建教程

原创于 2024-11-05 16:31:10 发布 · 1.3k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#图像识别 #布局分析 #网页信息处理 #阅读编辑 #人工智能 #AI #数据提取

模型构建专栏收录该内容

243 篇文章

订阅专栏

一、介绍

MinerU作为一款智能数据提取工具，其核心功能之一是处理PDF文档和网页内容，将其中的文本、图像、表格、公式等信息提取出来，并转换为易于阅读和编辑的格式（如Markdown）。在这个过程中，MinerU需要利用图像识别、文本识别（OCR）、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。

二、构建流程

系统：Ubuntu系统，

显卡：3090，

显存：24G，cuda11.8

特别提示：使用显卡3060也可以（没尝试，感觉可以）

1.查看系统是否有Miniconda3的虚拟环境

conda -V
如果输入命令没有显示Conda版本号，则需要安装。

屏幕截图

2.更新系统命令

输入下列命令将系统更新及系统下载

apt-get update && apt-get install ffmpeg libsm6 libxext6  -y

微信截图_20240820152809.png

3.创建虚拟环境

创建名称为MinerU的虚拟环境

conda create -n MinerU python=3.8

微信截图_20240903144226.png

激活“MinerU"虚拟环境

conda activate MinerU

微信截图_20240903144314.png

4.下载模型

输入下列命令对MinerU模型进行下载（11G左右）

git clone https://gitclone.com/github.com/opendatalab/MinerU.git

微信截图_20240903144718.png

进入模型文件

cd MinerU-master

微信截图_20240903145342.png

5.下载依赖包

输入下列命令：

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com

微信截图_20240903145522.png

下载时间会很长，耐心等待，直到出现“Successfully”开头的下载结果

微信截图_20240903151456.png

6.下载模型权重文件

输入下列命令进行下载：

git lfs install
git clone https://hf-mirror.com/opendatalab/PDF-Extract-Kit

微信截图_20240903164514.png

更改权重文件路径(后面运行找不到权重，你也可以更改运行代码的获取权重文件路径)：

cp -r /MinerU-madter/PDF-Extract-Kit/models  /tmp/

微信截图_20240903171353.png

7.项目运行

"try.pdf"是本上传用于测试的文档，你可以根据自己所需上传自己的PDF文档。

输入下列命令：

magic-pdf –path “try.pdf”

微信截图_20240903171335.png

解析结束：

微信截图_20240903171637.png

查看结果文件：

微信截图_20240903171646.png

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。