【技术白皮书】第四章:信息抽取技术产业应用现状及案例(上)

信息抽取技术在金融领域广泛应用,助力银行、证券等机构提升风控与信贷效率。例如,TextIn合同机器人用于智能抽取关键信息与比对,减少人工审核成本;天元大数据平台通过知识图谱技术,整合企业大数据,提供风险监控、尽职调查等功能;在供应链金融中,合合信息解决方案帮助识别企业关系、风险与舆情,优化信贷决策。此外,信息抽取还应用于新能源行业,助力企业开户审核与账户管理,以及小微企业银行账户服务,实现高效、安全的账户服务。

4.产业应用现状

4.1信息抽取技术的产业应用

信息抽取技术已发展多年,相关产业也日趋成熟,下面是几种主要的信息抽取产业应用:

  • 商业信息抽取:通过开发专门的信息抽取系统,分析各渠道收集的商业信息大数据,抽取诸如有关公司工商信息、舆情现状、风险监控等信息,提供决策支持信息。
  • 医疗信息抽取:医疗保健机构以及健康保险部门可以利用信息抽取系统,获取病人的症状、诊断情况、化验结果以及治疗情况,以便更好地提供医疗服务和保险服务。
  • 政务信息抽取:政务部门利用信息抽取系统,获取众多的政务文件中的有效信息,使政务服务更加的准确、高效。

4.2信息抽取技术的产业应用案例

4.2.1基于深度学习的信息抽取技术的TextIn合同机器人

在企业签订合同确立合作的业务流程中,合同比对是必不可少的一个环节。合同在文本确定前,往往经历了反复修改、版本迭代,或者存在电子版与纸质版之间的增减差异。在签订合同时,需要确保用印合同与审核通过的合同文本一致,关键信息齐备,以避免范本使用、文本修改、阴阳合同、函证造假等风险。

合合信息推出TextIn合同机器人,基于STR识别和NLP算法,开发出合同关键信息识别与抽取和合同比对两大核心能力,将合同文本进行自动识别与精准智能比对,快速展示差异结果,从而帮助企业降低合同风险,避免重大损失,同时提升工作效率,减少重复劳动,降低用人成本。助力企业实现合同全生命周期管理,在银行、保险、证券、资管、融资租赁、供应链金融等泛金融业务以及企业法务合同审阅场景中都有突出应用。

在合同审阅与管理流程中,不同的合同往往需要抽取不同的关键信息,比如购销合同需要抽取甲乙方、合同金额等信息,租赁合同需要抽取承租方、出租方、租赁费用、保证金等信息,施工合同需要抽取工程名称、工程地点、开工日期等信息,基金合同需要抽取基金委托人、管理人、募集期等信息。

统一的标准化的抽取字段无法满足所有类型合同的抽取需求,故此,TextIn合同机器人推出了“按合同分类抽取信息”的新功能。用户可在“关键信息配置”中,对合同类型进行分类,并针对每一种合同类型自定义创建所需的抽取字段。

在这里插入图片描述
将合同按照分类上传后,合同机器人即可自动抽取出所配置的关键信息及印章信息。

核心功能:
  • 智能抽取关键信息与印章信息
    支持识别图片(png、jpg、jpeg、tif、tiff)、Word、PDF、Excel格式合同,智能抽取关键信息与印章信息。支持按合同分类自定义设置关键信息字段。印章信息涵盖印章类型与主体信息,印章类型包括:公章、合同专用章、法定代表人章、财务专用章、发票专用章、业务专用章。
    在这里插入图片描述
- 关键信息比对

支持对合同中抽取出的标准信息与自配置信息进行智能比对,快速定位关键信息差异项,一键导出Excel、Word、PDF差异报告。
合同中常常存在大量的表格信息,表格识别与比对也是合同比对中的一项难点。
合同机器人基于复杂的信息抽取和文字检测与识别技术,不仅可以高精度识别不同格式文档中的表格信息,显示全字段比对差异,且对表格比对样式做了优化,按照单元格对内容差异进行对齐与列表显示,便于更清晰直观地锁定合同差异。
在这里插入图片描述

应用场景
  • 保险合同管理
    帮助保险企业将OA系统中通过审核的合同与风险系统中上传的用印版合同进行比对,如存在差异,发出预警,规避合同伪造风险;将承办人提交的合同与同类型合同模板条款比对,提醒差异、缺少情况,如合同模板由对方提供,则提取关键信息,与后台规则进行匹配。

  • 银行信贷审批
    帮助银行对租赁合同、经营实地场所、农村产权承包证等材料进行印章存在性判存、手写签字判存,对待审议合同与合同模板进行比对,判断条款是否有增、删、改。

  • 企业法务审核
    帮助企业法务部门对各文档版本的迭代进行管控,便于在双方法务反复修改合同环节提高效率、减少人为错误。

  • 采购防范风险
    帮助企业采购部门在前期洽谈合同环节中,防范“阴阳合同”、函证造假风险,识别纸质合同上的差异并展示。


4.2.2融合基于深度学习的信息抽取的知识图谱的天元大数据平台

金融风控,面临着信息过载与信息稀缺的双重困境。一方面,由于系统、数据等的孤立,普遍存在信息孤岛,很难获取高质量的信息或者容易产生信息不一致、不完整、片面化,而风控的复杂性又要求对多维度信息的系统性采集、整体性分析;另一方面,来自各外部渠道、各业务条线中的信息庞杂,很难进行数据的真实性、有效性判断,更难对大量数据进行规模化处理,挖掘数据的内在联系。

在这里插入图片描述

金融领域数据是典型的具有”4V”特征的大数据(海量Volume、多结构多维度Variety、价值巨大Value、及时性要求Velocity)。

知识图谱,可以通过可视化技术,挖掘、分析、构建、绘制和显示大数据之间的相互联系,很好地解决金融数据应用的难点。 合合信息深耕知识图谱领域10多年,通过复杂的基于深度学习的信息抽取技术,面向银行、证券、保险、融资租赁、供应链金融平台等机构的风控需求,推出了多种关系图谱。这些关系图谱多方位地展示了企业与自然人的投资、任职、担保、诉讼、上下游、疑似等关系,在泛金融企业的授信、投资、反洗钱、反欺诈、尽职调查、监控预警等风控场景中都有重要应用。

  • (1)集团关系抽取
    利用全量工商股权数据,结合《大额风险暴露管理办法》关联客户识别方法进行建模,抽取企业间的股权投资关系,分析企业集团派系。

在这里插入图片描述

  • (2)交易关系抽取
    结合客户内部交易数据,通过信息抽取和挖掘分析所有的企业交易数据信息,最终得到行内企业交易关系。

在这里插入图片描述

  • (3)股权穿透抽取
    基于大数据计算和信息抽取,精确分析企业背后的股权结构,清晰展示披露至自然人、法人层级的企业全部合伙人情况。

在这里插入图片描述

  • (4)诉讼关系抽取
    利用全量的司法诉讼数据包括立案信息、开庭公告、法院公告和裁判文书等信息,通过信息抽取技术挖掘出企业司法诉讼关系

在这里插入图片描述

  • (5)事件关系抽取
    利用信息抽取技术,根据企业的新闻动态及舆情数据,计算出企业之间的事件关系,输出负面指数高,近6个月内的14类舆情关系。
    在这里插入图片描述

  • (6)上下游关系与竞争关系抽取
    利用信息抽取技术,通过供应商公告、招标、投标、中标信息等数据,展现企业与上游供应商、下游客户、竞争对手的关系。

在这里插入图片描述

合合信息依托旗下启信宝所汇聚的境内2.3亿家企业等组织机构的超过1000亿条实时动态商业大数据,结合多家头部企业大数据平台建设项目经验所沉淀的业务应用方案与技术方案,基于自研的融合基于深度学习的信息抽取的知识图谱技术,推出了天元大数据应用平台。

在这里插入图片描述

数据质量保障机制

通过多种数据采集、清洗与校验手段,依托严格的流程控制,提升数据的全面性与准确性。
在这里插入图片描述

数据看板

动态呈现区域内企业布局与发展情况,为金融企业提供对公营销渠道与营销决策数据支撑。

在这里插入图片描述

业务首页

聚合应用入口,一键搜索企业与关键人员信息。

在这里插入图片描述

核心应用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述


客户案例
  • 某股份制银行
    某股份制银行携手合合信息,搭建大数据风险门户,将行内信贷、担保等数据与合合信息旗下启信宝大数据相结合,实现了企业多维搜索、风险智能关联、舆情信息分析、图谱关联分析、信息智能视图、内外风险评估等应用。
    上线后,行内有近万名员工使用了风险门户,其中客户经理4500人,风险经理2200人,共有55家分行、子公司通过风险门户排查企业风险情况。员工反馈,风险门户使得业务人员不再需要通过外部第三方平台查询企业相关信息,效率更高,数据维度更丰富,且通过融合行内大数据,使得隐性担保圈链、企业间交易关系等得以跨分行全景呈现,打破了信息孤岛。

    在这里插入图片描述

  • 某经济强市头部农商行
    某经济强市头部农商行与合合信息合作,搭建大数据应用门户,满足统一业务部门、经营部门、管理部门、风控部门各业务条线获取数据的平台、渠道、标准,赋能全行数字化转型核心战略。
    该大数据应用门户搭载了企业画像、企业图谱、风险监控、数据可视化驾驶舱等知识图谱应用与TextIn财报机器人等智能文字识别应用,满足了多部门的风控、反洗钱合规、营销需求,例如合规法务部的对公客户背景深度透视、反洗钱合规审查、分支行对公业务合规监管,普惠金融事业部的区域对公客户营销、贷前综合审查、贷后综合管理、政策解读与对应产品规划,授信审批部的关联方识别与统一授信、多维度授信核查、监管法规解读与重大风险事项洞察等业务场景中,都能通过该大数据应用门户,获得多维度内外部数据支撑。

在这里插入图片描述


4.2.3供应链金融解决方案

供应链金融是指从供应链产业链整体出发,运用科技手段,整合物流、资金流、信息流等信息,在真实交易背景下,构建供应链中占主导地位的核心企业与上下游企业一体化的金融供给体系和风险评估体系,提供系统性的金融解决方案,以快速响应产业链上企业的结算、融资、财务管理等综合需求,降低企业成本,提升产业链各方价值。

合合信息基于智能文字识别技术、启信宝大数据挖掘与知识图谱等能力,已助力多家供应链金融企业在证件单据识别录入、融资企业授信风控、产业链供应链分析上,实现了业务流程自动化、智能化,并有效提升了对上下游融资企业的信用风险控制能力。

证照票据智能识别录入

有融资需求的上下游企业通过供应链金融平台自主提交融资申请时,需要提交企业证照、承兑汇票等资料,便于平台审核。

合合信息提供100+种卡证照识别模块,覆盖金融场景下常见证照类型,如:身份证、银行卡、房产证、营业执照等。其中,身份证识别支持自动判断正反面,自动判断原件、彩色件、复印件;银行卡识别支持全球不同国家、不同行业的借记卡与信用卡,VISA、JCB、银联卡、Master卡、美国运通卡等国内外银行卡皆可准确识别;营业执照识别支持新旧不同版式,自动区分是否为副本、是否为电子营业执照,还可通过API接口调用启信宝大数据,对营业执照进行自动验真,防范证照造假、失效风险。

在这里插入图片描述

另外,合合信息还支持对不同版式的电子银行承兑汇票与商业承兑汇票、增值税发票等多类型票据进行智能分类,并高精度识别后自动录入系统,增值税发票支持自动验真,极大地提升了业务效率,释放人力。

平台数据结合外部数据,灵活授信

不同企业提交的融资申请金额不同,供应链金融平台需要根据企业资信对融资金额进行评定。供应链金融中对企业资信的评估,一方面依赖上下游融资企业与核心企业间的交易数据,由此解决了上下游中小微企业信用信息少、信息相对不透明的困境,这些交易数据由供应链金融平台进行采集与标准化,是核心授信数据,另一方面,也要结合外部大数据,对融资企业的工商、司法涉诉、经营风险等进行尽职调查。

企业风险全景尽调
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值