初次接触,学习笔记,可能会存在过多疏漏
[1]CRNN原理
1,结构图
**主要包括:**卷积层(CNN),循环层(RNN),转录层(CTC)

2,整个模型的特点
1,不用没每个字符打标签,只需要给一个图片打一个序列标签。
2,利用CNN提取图像特征
3,利用RNN训练的输入特征序列,得到一个序列标签
4,对训练的图像没有长度限制,但是要将图片的高度归一化
5,参数少
6,虽然结合了CNN和RNN,但是最后用一个loss函数(CTC LOSS),实现啦端到端的训练。

CNN feature map
假设CNN得到的feature map大小为m*T,下文得到的时间序列t都从t=1开始,1=<t<=T。
本文是初次接触CRNN模型的学习笔记。介绍了CRNN模型的结构图,主要包括卷积层(CNN)、循环层(RNN)、转录层(CTC)。还阐述了模型特点,如只需给图片打序列标签、用CNN提取特征、RNN训练得序列标签等,实现端到端训练。
1万+

被折叠的 条评论
为什么被折叠?



