深度学习应用趋势与准牛顿优化方法
1 深度学习应用趋势
1.1 视频中的人类动作识别
在视频里识别人类动作颇具挑战,比如场景存在遮挡、背景杂乱、相机运动等情况,而且不同人做相同动作也会有差异。为解决这些问题,可采用基于深度卷积神经网络(CNNs)的方法,具体操作步骤如下:
1. 选择互补模态 :使用RGB帧、光流图像和视觉节奏这三种互补模态。RGB帧用于探索连续帧中物体的空间属性,光流图像用于探索时间属性,视觉节奏可将整个视频(时空)编码为单张图像。
2. 构建深度CNNs :为每种模态分别构建一个深度CNN,并使用相应模态对其进行微调。
3. 应用融合策略 :采用简单平均、加权平均、外部全连接层这三种不同的融合策略,为输入视频获取单个得分向量。外部全连接层可确定各特征(模态)对最终预测的贡献程度。
4. 测试方法 :利用从商业和非商业来源收集的视频序列进行测试,包括模糊视频、低质量视频以及不同视角的动作视频。
1.2 回归与分类中的深度学习
训练用于分类/回归任务的CNN模型需要大量带标签的训练数据,获取这些数据既耗时又昂贵。主动学习算法可自动从大量未标记数据中识别出具有代表性的实例子集,从而减少人工标注工作量和机器学习模型的训练计算量。以下是相关操作步骤:
1. 集成主动学习机制 :将主动学习机制与深度卷积神经网络集成用于图像回归任务,其目标是使用少量标记数据和大量未标记数据进行回归。
2.
超级会员免费看
订阅专栏 解锁全文
1656

被折叠的 条评论
为什么被折叠?



