深度学习在人类活动识别计算机视觉中的应用
在当今的科技领域,深度学习(DL)方法在计算机视觉领域引发了一场革命,尤其是自2012年以来。这场变革主要得益于两个关键因素:一是像ImageNet这样包含数百万张图像的大型公开标注图像数据集的出现;二是采用并行GPU计算来加速深度模型的训练,取代了基于CPU的方法。
1. 深度学习算法概述
深度学习算法众多,各有特点和适用场景。下面是几种常见深度学习算法的比较:
| 参数 | 算法描述 | 学习类型 | 主要任务(应用) | 输入数据 | 输出 | 优势 | 劣势 |
| — | — | — | — | — | — | — | — |
| 受限玻尔兹曼机(RBM) | 属于基于能量模型的无监督神经网络 | 无监督 | 模式识别和推荐引擎特征提取 | 所有类型的数据 | 重建输入 | 学习算法可高效利用大量未标记数据进行无监督预训练 | 训练时计算能量梯度函数非常困难 |
| 深度信念网络(DBN) | 由多个无监督受限玻尔兹曼机(RBM)堆叠而成的网络模型 | 有监督 | 主要用于识别、聚合、生成图像、视频序列和运动捕捉数据 | 文本和图像 | 分类和规划输出 | 即使使用小的标注数据集也能工作 | 计算时间长,学习模型所需时间久 |
| 自编码器 | 将多维数据转换为低维数据的算法 | 无监督 | 用于医疗行业的医学成像(乳腺癌检测) | 所有类型的数据 | 重建输入 | 利用多个编码器和解码器层可在一定程度上降低计算成本 | 编码后可能丢失原始输入的重要数据 |
| 卷积神经网络(CNN) | 具有执行卷积操作的隐藏层的流行深度学习算法 | 有监督 | 主要用于图像识别和目标检测任务 | 3D
深度学习在人类活动识别中的应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



