LSTM和DenseNet区别

一 LSTM和DenseNet

t是深度学习两种重要设计哲学完全不同神经网络架构核心区别可以总结为LSTM用于处理序列数据循环网络核心 时间记忆传递DenseNet用于处理空间数据前馈网络核心深度特征复用

核心区别对比表

对比维度

LSTM

DensetNet

主要设计目的

处理序列数据 文本语音时间序列捕捉时间维度长期依赖关系

处理网格数据缓解深度网络梯度消失促进特征层间复用

核心思想

门控机制通过遗忘输入输出有选择传递更新输出信息形成一条记忆传送带

密集连接每一层都接收前面所有特征图作为输入将其输出传递给后面所有

数据流向

循环/时间展开信息沿时间步顺序传递网络权重时间共享

前馈/空间加深信息浅层深层单向流动每一层都能直接获取原始所有中间特征

连接方式

链式结构当前时刻隐藏状态h_t细胞状态C_t传递下一时刻

全连接拓扑l之前0,...l-1都有直接连接形成密集连接块

关键特征

具有内容状态 细胞状态擅长建模动态时间行为

特征数量增长参数相对高效具有强大特征传播能力

典型应用领域

机器翻译文本生成语音识别股票预测

图分类目标检测医学图像分析

1 基于DenseNet网络模型序列特征提取

DenseNet是一种有效图像识别算法网络优点在于减轻深层网络梯度消失问题增强特征传播利用率减少了模型参数ResNet基础进一步加强特征之间的连接构造一种具有密集连接方式卷积神经网络

DenseNet网络模型核心组成部分密集连接模块这个模块任意两层之间直接连接网络第一层第二层 L-1输出都会作为L输入同时L特征也会直接传递后面所有作为输入

2 基于LSTM结构上下文序列特征提取

含有丰富上下文信息同一文本行不同字符可以互相利用上下文信息这对于字符识别具有重要影响一些模糊字符观察上下文更容易区分在卷积网络之后构建了一个循环网络用于提取文本序列上下文序列特征

双向LSTM能在访问之前信息同时访问字符之后信息故能正反两个方向提取文本语义信息有助于文本行识别任务因此双向LSTM可以同时处理上文下文信息提取上下文序列特征

字符序列的解码方式

在文本识别网络模型LSTM输出序列字符标签字符位置一一对应使用softmax函数作为损失函数进行训练训练网络参数需要在图像标注每个位置信息使用手工标注样本工作量非常大所以需要解码使字符位置--对应下面介绍两种常用机制

1 基于CTC解码机制

CTC机制常用语文字识别系统解决序列标准问题输入标签输出标签对其问题通过映射数据对齐处理减少了工作量广泛用于图像文本识别损失函数计算多用于网络参数优化

解码模型预测过程LSTM输出预测序列通过分类转换标签序列过程解码过程的分类方式最优路径编码输出计算概率最大一条路径作为最终预测序列每个时间点输出概率最大字符

2 Attention模型注意力机制解码方式

注意力机制广泛用于序列处理Seq2Seq任务注意力模型借鉴人类视觉选择性注意力机制核心目标众多信息选出当前任务目标来说重要信息忽略其他不重要信息

含有文本图片而言文本识别输出结果顺序取决于文本行中字符前后位置信息引入注意力机制可以起到定位作用从而突出字符位置信息解决序列对齐问题因此不需要标准文本位置

Attention 模型原理计算当前输入序列输出序列匹配程度在产生每一个输出会充分利用输入序列上下文信息同一序列不同字符赋予不同权重

三 DenseNet的数学表示

第一输入x0->h1->输出x1

第二层输入x1,x0->h2->输出x2

第三层输入x2,x1,x0->h3->输出x3

第四层输入x3,x2,x1,x0->h4->输出x4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值