读后记GAIT RECOGNITION BASDED ON CONTOURLET TRANSFORM AND COLLABORATIVE REPRESENTATION

本文介绍了Contourlet变换及其在图像处理中的应用,对比了与FFT、DCT等变换方式的不同之处,指出Contourlet变换恢复误差最小。此外,文中还提到了CRC而非SRC的应用,强调在识别分类任务中Collabrate的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

该文发表在ICSP2014 Proceedings 

作者及单位:Jieru Jia1,2, Qiuqi Ruan1,2 
1 Institute of Information Science, Beijing Jiaotong University,Beijing 100044, China 
2 Beijing Key Laboratory of Advanced Information Science and Network Technology,Beijing 100044, 
China 


主要思路,贡献:

1、Contourlet transform的应用,并实验比较FFT,DCT等变换,Contourlet 变换恢复的误差最小。

2、使用了CRC而不是SRC。(2011ICCV的文章,说明SRC中collabrate比Sparse对识别分类更有效)


内容:

1、Contourlet 变换:针对小波变换的缺点,2002年M.N.Do和M.Vetterli提出了一种“真正的”二维图像的表示方法—Contourlet变换。

Contourlet

变换将尺度分析和方向分析分开进行。首先,采用拉普拉斯金字

塔变换

(

Laplacian Pyramid

LP

)

 

对图像进行多尺度分解,

以捕获奇异点;

然后,

对每一级金字塔分解的带通分量用方向滤波器组

Directional Filter Bank

DFB

进行多方向分解,将同方向的奇异“点”合成“线”

,这样

LP

分解得到的带通

图像传递到

DFB

后能获得不同方向的子带图像,经过迭代

Contourlet

变换可将

图像分解为多个尺度多个方向上的子带图像。

Contourlet变换将尺度分析和方向分析分开进行。首先,采用拉普拉斯金字塔变换(Laplacian Pyramid,LP) 对图像进行多尺度分解,以捕获奇异点;然后,对每一级金字塔分解的带通分量用方向滤波器组(Directional Filter Bank,DFB)进行多方向分解,将同方向的奇异“点”合成“线”,这样LP分解得到的带通图像传递到DFB后能获得不同方向的子带图像,经过迭代Contourlet变换可将图像分解为多个尺度多个方向上的子带图像。

Do和Vetterli提出了一种DFB算法。该DFB算法采用扇型QFB,无需对原始信号进行调制,并且采用简单的树型结构就可以得到完美的频率划分。其思想是将扇型QFB与可以实现“旋转”的图像重采样相结合,获得楔型频率划分。由于重构可以看成是分解的对偶过程。



2、CRC

(1)原始SR目标函数


(2)CRC目标函数(更快求解)



最主要贡献:Counterlet变换在Gati中的应用。

### 大型视觉模型在步态表示学习中的应用 #### BigGait:利用大型视觉模型进行步态表示的学习与实现 近年来,随着计算机视觉技术的发展,基于深度学习的大规模视觉模型逐渐被应用于各种生物特征识别领域,其中包括步态识别。这些大规模视觉模型能够捕捉到更复杂的空间结构和时间动态特性。 为了提高跨视角下的步态识别性能,研究人员探索了多种方法来增强模型对于不同角度下人体运动模式的理解能力。一种有效的方式是采用多任务生成对抗网络(MTGAN),该架构不仅可以在单个框架内完成多个子任务的同时优化,还能够在不同的视图之间共享有用的表征信息[^1]。 此外,在构建高质量的数据输入方面也进行了创新尝试。例如引入周期能量图像(PEI)作为改进版的步态模板形式,相较于传统的灰度编码图像(GEI)和其他同类方案,它能更好地保留时空维度的信息量。 具体来说,BigGait项目旨在开发一套完整的解决方案用于高效地提取并分析个体行走姿态特征: - **数据预处理**:收集来自不同环境条件下的视频片段,并将其转换成适合喂入神经网络的形式; - **模型设计**:选用先进的卷积神经网络(CNN)或Transformer变体作为骨干网路部分; - **训练策略**:实施迁移学习机制以便充分利用已有的大规模通用物体检测/分类数据集资源; - **评估体系**:建立严格的测试流程以验证算法的有效性和鲁棒性。 ```python import torch from torchvision import transforms, datasets from biggait.models import BigGaitModel transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor(), ]) dataset = datasets.ImageFolder(root='path/to/dataset', transform=transform) model = BigGaitModel(pretrained=True).cuda() for images, labels in dataset: outputs = model(images.cuda()) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值