45、实体提取、校正与椭圆检测方法解析

实体提取、校正与椭圆检测方法解析

实体提取与校正

在实体提取与校正领域,对于扫描发票中的实体提取,提出了一套有效的方法。

相关令牌聚类

首先是相关令牌聚类步骤,提出了一个校正模块用于消除多余的令牌。该模块通过测量连续令牌 $T F_i$ 和 $T F_j$($j = i + 1$)之间的距离来建模结构的几何关系,每个距离的计算公式为:
$d_{ij} = xF_j - (xF_i + wF_i)$

使用增量算法(如算法 2 所示)来连接相关令牌。

Algorithm 2. Incremental algorithm
1: Input: SetF // Entity containing at least one token and may contain noisy
tokens SetN = {T N
i |SetN ⊂SetF}
2: Output: RT = SetF/SetN// Relevant tokens
3: begin
4:
while SetF ̸= ∅do
5:
if SetF = 1 then
6:
RT = SetF
7:
elseif SetF > 1 then
8:
for j = 1 : SetF −1 do
9:
if dij ≤S then
10:
T F
i = concat(T F
i , T F
j )
11:
T F
j = []
12:
elseif dij > S then
13:
RT = SetF/SetN
14:
end if
15:
end for
16:
return RT = SetF/S
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值