开源项目 `unstructured-inference` 使用教程

最新推荐文章于 2024-11-18 10:02:27 发布

邬祺芯Juliet

最新推荐文章于 2024-11-18 10:02:27 发布

阅读量669

点赞数 5

本文链接：https://blog.youkuaiyun.com/gitblog_00280/article/details/141494890

版权

开源项目 `unstructured-inference` 使用教程

unstructured-inference项目地址:https://gitcode.com/gh_mirrors/un/unstructured-inference

项目介绍

unstructured-inference 是一个用于执行推理的库，主要用于布局解析模型的推理。这些模型通过 API 调用，作为 unstructured 包中的分区模块的一部分。该项目支持多种检测模型，包括 Detectron2 和 YOLOX，适用于处理 PDF、HTML、CV、XML 等格式的数据。

项目快速启动

安装

首先，你需要安装 unstructured-inference 包。你可以通过以下命令进行安装：

pip install unstructured-inference

使用示例

以下是一个简单的使用示例，展示如何使用 unstructured-inference 进行文档布局解析：

from unstructured_inference.models.base import get_model
from unstructured_inference.inference.layout import DocumentLayout

# 获取模型
model = get_model("yolox")

# 从文件进行布局解析
layout = DocumentLayout.from_file("sample-docs/layout-parser-paper.pdf", detection_model=model)

# 输出解析结果
print(layout)