无线多媒体传感器网络中的深度学习与计算机视觉算法
1 深度学习实用方法
1.1 循环神经网络(RNN)
循环神经网络(RNN)广泛应用于处理序列数据,如时间序列、文本和语音等。在这些数据中,某一时刻的数据依赖于之前的数据。RNN 模型的输入是当前时刻 t 的数据和 t - 1 时刻的隐藏状态,输出目标值和新的隐藏状态。然而,RNN 存在梯度爆炸和梯度消失的问题。为了解决这个问题,引入了长短期记忆网络(LSTM)。LSTM 架构包含三个门:输入门、输出门和遗忘门。
1.2 自编码器(AE)
自编码器(AE)模型通过级联的两个网络学习数据从输入域到目标域的映射。编码器阶段将数据投影到潜在空间表示,解码器阶段对其进行解码。AE 已应用于多种任务,如语义分割、图像着色、超分辨率、3D 构建和呈现攻击检测等。
1.3 生成对抗网络(GAN)
生成对抗网络(GAN)由生成器和判别器组成。生成器通常是一个编码器 - 解码器网络,将输入数据映射到一种能够欺骗判别器的表示。GAN 使用极小极大博弈进行训练,生成器的目标是最大化判别器的错误,而判别器则试图最小化分类错误。
1.4 移动神经网络
深度神经网络(DNN)对内存和计算资源的需求较大,可能不适用于移动和资源受限的应用。这些应用通常受到内存、功率和计算资源的限制,并且存在延迟问题。例如,便携式设备上的算法处理输入信息的时间不应超过 3 - 4 秒。在大多数情况下,可以在不显著牺牲性能的前提下减少 DNN 的参数空间。例如,MobileNets 采用深度可分离卷积来减少参数空间,后来通过引入倒置残差和量化对其进行了改进。商业上,采
超级会员免费看
订阅专栏 解锁全文
53

被折叠的 条评论
为什么被折叠?



