35、RGB - D物体识别的分层特征表示学习方法

RGB - D物体识别的分层特征表示学习方法

1 引言

物体识别在计算机科学领域是一项至关重要的能力,吸引了计算机视觉、机器学习和机器人学等不同领域研究人员的关注。在过去几十年里,众多特征和分类算法被提出并应用于该问题,使得物体识别能力取得了显著进展,这从Caltech101和CIFAR等标准基准测试的稳步提升中可见一斑。

新兴的RGB - D(类似Kinect)和深度相机技术迅速成熟,能够提供高质量的彩色和深度同步视频,为基于颜色和深度的识别融合带来了绝佳机会。目前,大多数RGB - D图像物体识别方法采用手工设计的特征,如2D图像的SIFT、3D点云的Spin Images、特定的颜色、形状和几何特征以及学习型特征描述符等。

稀疏表示是一种强大的图像表示模型,在图像标签、图像注释和图像分类等诸多问题中得到广泛应用。稀疏表示分类器(SRC)将整个训练样本集作为字典进行图像分类,在人脸识别方面表现出色。然而,稀疏表示未能充分利用训练数据的结构信息。

为解决这一问题,本文提出一种从RGB - D图像中学习分层特征表示的高效模型。该模型运用卷积递归神经网络(CNN - RNN)提取原始RGB - D图像的低级不变特征,并将这些特征输入到块组稀疏表示(BGSC)中,以构建更高级的特征。目标是通过应用CNN - RNN和BGSC方法进行RGB - D物体识别,学习分层特征表示。

2 利用CNN - RNN和BGSC学习分层特征表示

2.1 第一层特征的CNN - RNN模型

建立了基于CNN - RNN的第一层特征学习模型。具体步骤如下:
1. 对每个尺寸为(高度和宽度)$d_I$的图像,用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值