CTC介绍(connectionist temporal classification论文翻译)

本文深入解析CTC(Connectionist Temporal Classification)技术,探讨其在序列标注任务中的应用,特别是与RNN结合处理未分割序列数据的优势。文章对比了CTC与其他模型如HMM和CRF,阐述了CTC在网络输出到标签转换、构建分类器及神经网络训练过程中的关键步骤。

1.摘要

我基本是基于论文《Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 》进行翻译总结的。看论文题目就知道CTC与RNN密切相关,联系在一起的,以及应用于不分割(Unsegmented )序列,点对点预测。

在CTC(connectionist temporal classification)前,HMMs(隐马尔可夫模型hidden Markov Models)、CRFs(条件随机场模型conditional random fields)以及相关变体,是主要用来进行序列标注的方法。这些方法一是需要大量的目标识别知识,二是有一些假设条件,比如HMM的独立分布性假设,三是比如HMM,即使序列标准是不恰当的,也可以进行训练。

HMM-RNN模型,可以处理长序列结构的数据。但是其中HMM是自动分割序列,然后转换网络分类到标签序列,没有有效利用整个序列的特点。

CTC不需要预分割训练数据、后期加工的输出,直接作用于整个序列。CTC是把网络输出作为基于输入序列的所有可能标签序列的一个概率分布。

2.Temporal Classification

X:输入空间。m 维实数向量
Z:目标空间,Z=L*。基于标签的字母表L的序列集合。
L
:L*中的(多个)元素是标签序列的来源。
S:基于固定的分布D(X,Z)获得的训练样本集。S中的每个样本是(x,z)。目标序列z = (z1, z2, …, zU ) ,输入序列x = (x1, x2, …, xT )。z 的长度U要小于x的长度T,即U<=T。也就是输入与目标的长度可以不一致。
h : X → Z的函数,该函数定义为temporal classification
S`:属于固定的分布D(X,Z),但与S不相交的集合。
ED(p, q):p序列与

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI强仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值