RGB - D物体识别的分层特征表示学习方法
1 引言
物体识别在计算机科学领域是一项至关重要的能力,吸引了计算机视觉、机器学习和机器人学等不同领域研究人员的关注。在过去几十年里,众多特征和分类算法被提出并应用于该问题,使得物体识别能力取得了显著进展,这从Caltech101和CIFAR等标准基准测试的稳步提升中可见一斑。
新兴的RGB - D(类似Kinect)和深度相机技术迅速成熟,能够提供高质量的彩色和深度同步视频,为基于颜色和深度的识别融合带来了绝佳机会。目前,大多数RGB - D图像物体识别方法采用手工设计的特征,如2D图像的SIFT、3D点云的Spin Images、特定的颜色、形状和几何特征以及学习型特征描述符等。
稀疏表示是一种强大的图像表示模型,在图像标签、图像注释和图像分类等诸多问题中得到广泛应用。稀疏表示分类器(SRC)将整个训练样本集作为字典进行图像分类,在人脸识别方面表现出色。然而,稀疏表示未能充分利用训练数据的结构信息。
为解决这一问题,本文提出一种从RGB - D图像中学习分层特征表示的高效模型。该模型运用卷积递归神经网络(CNN - RNN)提取原始RGB - D图像的低级不变特征,并将这些特征输入到块组稀疏表示(BGSC)中,以构建更高级的特征。目标是通过应用CNN - RNN和BGSC方法进行RGB - D物体识别,学习分层特征表示。
2 利用CNN - RNN和BGSC学习分层特征表示
2.1 第一层特征的CNN - RNN模型
建立了基于CNN - RNN的第一层特征学习模型。具体步骤如下:
1. 对每个尺寸为(高度和宽度)$d_I$的图像,用
超级会员免费看
订阅专栏 解锁全文
2735

被折叠的 条评论
为什么被折叠?



