TF-ID:精准提取学术文章中的表格与图像

TF-ID:精准提取学术文章中的表格与图像

TF-ID TF-ID: Table/Figure IDentifier for academic papers TF-ID 项目地址: https://gitcode.com/gh_mirrors/tf/TF-ID

项目介绍

TF-ID(Table/Figure IDentifier)是一个针对学术文章中表格和图像进行检测和提取的开源模型库。该模型库由Yifei Hu创建,并提供了四种不同版本的模型,以满足不同的使用需求。TF-ID基于microsoft/Florence-2模型进行微调,所有模型权重和人工标注的数据集均在MIT许可下开源。

项目技术分析

TF-ID模型的核心是基于深度学习的对象检测技术。它通过对大量的学术文章图像进行训练,能够准确地识别并提取出文章中的表格和图像,甚至包括它们的标题文本。以下是TF-ID的四个模型版本:

  • TF-ID-base:基础版本,包含提取表格/图像及其标题文本的功能,模型大小约为0.23B。
  • TF-ID-large:推荐版本,包含提取表格/图像及其标题文本的功能,模型大小约为0.77B。
  • TF-ID-base-no-caption:基础版本,仅提取表格/图像,不包含标题文本,模型大小约为0.23B。
  • TF-ID-large-no-caption:推荐版本,仅提取表格/图像,不包含标题文本,模型大小约为0.77B。

这些模型都从microsoft/Florence-2模型的预训练权重开始微调,以适应特定的任务需求。

项目及技术应用场景

TF-ID模型可以广泛应用于学术研究、文献分析、知识库构建等领域。以下是几个具体的应用场景:

  1. 文献自动化解析:在处理大量学术文献时,TF-ID可以帮助研究人员快速定位并提取关键信息,如表格、图像和相应的标题文本。
  2. 学术数据库构建:TF-ID可以辅助构建学术数据库,自动提取并分类学术文章中的图像和表格数据,提高数据库的构建效率。
  3. 智能文献推荐:通过分析学术文章中的图像和表格内容,TF-ID可以提供更精准的文献推荐服务。

项目特点

TF-ID模型具有以下显著特点:

  • 高准确性:在测试数据集上,TF-ID模型的正确输出率高达97%以上,表现出色。
  • 多版本支持:提供了包含和不包含标题文本的多个版本,以满足不同的使用需求。
  • 易于部署:项目提供了详细的训练和部署指南,用户可以轻松地在自己的环境中训练和使用模型。
  • 开源友好:所有模型和数据集均在MIT许可下开源,用户可以自由使用和修改。

结语

TF-ID是一个功能强大的开源项目,能够为学术研究和文献处理带来极大的便利。无论是自动化解析文献、构建学术数据库,还是实现智能文献推荐,TF-ID都能提供高效、准确的服务。如果你在处理学术文献时需要提取表格和图像信息,TF-ID将是一个不可错过的工具。通过合理地使用和部署TF-ID,可以极大地提高学术研究的工作效率,加速知识的传播与创新。

TF-ID TF-ID: Table/Figure IDentifier for academic papers TF-ID 项目地址: https://gitcode.com/gh_mirrors/tf/TF-ID

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

何将鹤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值