AI 在文档理解领域的现状与未来

我们正站在人工智能新时代的风口上。在过去的一年里,生成模型的快速发展令人瞠目结舌。从能够使用DALL-E 3生成极富想象力的图像,到使用 ChatGPT 生成言辞优美、表达流畅、富有感染力的文章,这些模型展示出这段时间人工智能技术取得的巨大进步。

然而,在更专业的人工智能领域——文档理解,也在悄然发生着同样深刻的变化,尽管这种变化并不那么轰动。这一领域的最新进展有望实现自动推理非结构化企业数据中的大量信息,或将进一步推动人类生产力的发展、提质。

据估计,超过 80% 的潜在可用业务信息存储在扫描文档、表格、合同、电子邮件和其他非结构化数据源(unstructured data sources)中。 这是一笔惊人的知识财富。然而,计算机在处理这些信息时,缺乏人类所具备的直觉和对细节的理解能力。

当今最优秀的人工智能系统能够以相当高的准确率识别日期、名称和金额等信息。但是,对于概念之间层次关系的深层语义把握、基于证据进行逻辑推理,以及其他处理非结构化数据时将会面临的复杂情况和难题,目前仍然是一大挑战,需要进一步突破。

例如,通过交叉引用交易截止日期(due date)并将其与单独的付款通知文件(payment advice documents)关联起来,从发票中推断出付款日期(payment dates),这需要考虑到文档的相关背景,而不仅仅是简单地依据其中的某个信息。解决财务记录中的存在的不一致或矛盾之处,或针对商业活动或业务运营方面的问题或需求所提出的询问也需要如此。

能够最终破解这些难题的关键创新技术已经问世 —— 这些模型将强大的处理自然语言的神经网络模型(neural language foundations)与利用 Graphical and spatial encodi

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值