信息抽取UIE

本文介绍了使用飞浆UIE-X进行信息抽取,特别是事件抽取和时间抽取。在处理增值税发票数据集时遇到问题,如Numpy版本不兼容,以及在Label Studio中选择错误的模板。通过调整Numpy版本、正确选择模板、解决Label Studio的bug,最终实现text文本信息抽取并部署服务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

不是NER识别,而是信息/时间抽取,采用飞浆的UIE-X来做,之前有试,这次进一步加强。

事件抽取/信息抽取:王九胖7月8号9点在青台遇见二狗子一行,二狗子十分感谢九胖的热情接待,并赠送了自家的狗崽作为礼物。

这句话肯定要有“人物”,“时间”,“地点”,这是xinwen三要素吧,此为事件抽取,关系抽取则比较难,金九胖遇见二狗子?

  1. 例子尝试

1)安装飞浆OCR,因为数据来源是增值税发票数据集。


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小李飞刀李寻欢

您的欣赏将是我奋斗路上的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值