能够精准理解科学图表和专业符号的模型

部署运行你感兴趣的模型镜像

柱状图、折线图等图表常用于金融研报、学术论文等记录数据,但逆向拆解PDF、JPG/PNG格式图表为Excel等可编辑数据存在难点。如金融领域需解析上市公司年报、研报中的图表数据,文件多为PDF、图片格式,还不乏难批量处理的加密PDF;医学、工程等领域也有类似问题,尤其上世纪50-80年代的历史论文,常数据缺失、关键图表仅存低清扫描件。传统手动记录或尺子测量图表像素的方法,精准度无法保证,而准确提取图表数据对各领域研究分析至关重要。

图表识别要解决的,正是这些难题。目前,能将非矢量格式的图表解析为结构化数据的工具较为少见,且具有相当大的局限性。一方面,用户必须具备工程能力,另一方面,还需要拥有充分的计算资源,对非专业用户或少量解析需求而言成本过高。

为方便用户随时使用图表解析能力,TextIn文档解析上架新功能,通过线上参数配置即可调用,完成全文解析,无需对样本进行预先分割或其他预处理。

让我们来看几个例子

对于有数值标注的图表,TextIn文档解析可以直接输出准确表格,将其转化为结构化数据,方便后续的数据入库、分析或输入大模型进行处理。

对于没有明确数值的复杂图表,TextIn接口也会通过精确测量给出预估数值,在仅有扫描件、图片文件的情况下,帮助挖掘更多有效数据信息,完成分析及预测工作。

近期,大模型出色的性能和推理能力引起了广泛关注,大量企业或调用API,或在本地部署模型,运用大模型提升业务与办公效率。在上文我们提到的场景中,精准解析+强大推理,能实现更优秀的AI应用。以上文中的图表为例。图表展示了全球工业机器人销售额,我们向大模型上传文件,并提出问题。下方分别为直接上传PDF的回答上传TextIn解析后的Markdown文件获得的答复。

可以看到,未经过解析的柱状图对大模型的理解造成了干扰,经过图表转化后,模型给出了准确、优质的答案。大模型的迅速迭代发展正在改变传统的行业模式,文档解析等大模型加速器与之相辅相成,创造了更多应用可能性。

Textin上线新功能【图表识别】,可以智能解析图表属性Chart,并以Excel格式精准输出,帮助深度理解图表的结构、趋势和数据逻辑,让数据分析更高效当前功能已支持饼图、折线图、柱状图、雷达图、散点图等多种图表类型

参数配置方法:见下图。

立即体验 Textin图表解析功能https://cc.co/16YSWm

您可能感兴趣的与本文相关的镜像

ComfyUI

ComfyUI

AI应用
ComfyUI

ComfyUI是一款易于上手的工作流设计工具,具有以下特点:基于工作流节点设计,可视化工作流搭建,快速切换工作流,对显存占用小,速度快,支持多种插件,如ADetailer、Controlnet和AnimateDIFF等

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值