【论文阅读】Ensemble of pose aligned features for person re-identification

针对行人重识别领域,本文提出了一种创新的解决方案,通过整合外观相似性和空间约束的姿势对齐方法,以及多颜色空间描述符融合技术,有效应对姿态变化和光线亮度变化两大挑战,显著提升了识别准确率。

这篇文章是由华中科技大学 图像信息处理与智能控制教育部重点实验室完成,在Control Theory & Applications上被收录,文章对行人重识别的两大挑战:行人姿态变化和场景亮度变化提出改进措施。

在阅读这篇文章过程中感觉自己火候未到,有些内容半知半解,等或一段时间再进行更新

What

1、行人重识别在现实生活中有非常广泛的应用,目前解决这一领域的方法主要有基于表征学习(feature representation)和度量学习(metric learning)两大类。

2、根据姿态对齐方式的不同,行人重识别中的特征可以分为如下三类:
(1)holistic features
整体特征对整个行人进行特征计算,忽略了行人的姿态等变化
(2)Stripe-based features
基于条纹的特征假设图像同一水平面上的条纹代表相同的语义部分,由于这种方法的高效性和简洁性而受到广泛欢迎。
(3)Part-based features
虽然基于部分的特征具有非常好的实现效果,但通过精确的人工解析来实现粒度对齐模型仍然是一个难以解决的问题。

3、
人体语义相同的部分在灰度空间中看上去非常相似,所有人都是一种统一规范的姿势,所以语义相同部分的块可以在特征空间中实现聚类,块的垂直坐标可用于去确定提供信息来确定它是属于哪个部分的。

4、本文的贡献主要如下:
(1)提出一种把外观相似性和空间约束结合在一起的全新姿势对齐方法
(2)在四个颜色空间中计算颜色描述符,并通过结构化输出支持向量机来实现分数级别的融合。

How

1、姿势对齐
针对行人的姿态变化问题,首先对训练集中行人图片进行稠密图像块采样,从而获得图像块集合, 然后对每一个图像块提取其局部表观空间特征, 最后在此特征集上聚类得到通用的行人部件字典. 由于该部件字典编码了行人的部件信息, 因此通过该字典内的每一个码元可以建立两幅行人图像中特定图像块之间的对应关系. 将两幅行人图片的图像块集合分别向部件字典投影, 可以获得2幅行人图片姿态对齐后的图像块序列. 针当模型采用的特征过少时,模型无法对数据进行充分学习,从而忽略了一些训练集中的普遍规律。从这个角度出发,我们可以增加模型特征的维度,通过引入特征组合、高次特征来增大假设空间。

2、光线亮度变化
在姿态对齐后的图像块上分别提取4种颜色描述子, 并将不同颜色描述子下的图像块相似性进行分数级组合以获得更好的亮度不变性. 其中不同颜色描述子之间的组合系数通过结构化输出支持向量机学习得到.
在这里插入图片描述

结论

与当前的行人重识别最优方法相比,本文提出的方法可以有效提高准确率
在这里插入图片描述

### 基于深度学习的多模型集成在ECG心律失常分类中的应用 #### 多模型集成的优势 深度学习技术近年来被广泛应用于医疗领域,特别是在心电图(ECG)信号分析方面取得了显著进展。通过采用多模型集成的方法,可以有效提升心律失常分类的准确性与鲁棒性。这种方法的核心在于利用多个独立训练的子模型来捕捉不同层次的数据特征,并最终通过对这些子模型预测结果的融合实现更优的整体表现[^1]。 #### 数据预处理与特征提取 在构建基于深度学习的多模型集成系统之前,通常需要对原始ECG信号进行一系列预处理操作,包括去噪、基线漂移校正以及标准化等步骤。随后,可以通过一维卷积神经网络(CNN)、长短时记忆网络(LSTM)或其他先进的深度学习架构自动提取高维度特征向量作为后续分类的基础输入[^2]。 #### 集成策略的选择 对于多模型集成而言,常见的组合方式有投票法(Voting)、堆叠泛化(Stacking Generalization)和加权平均等多种形式。其中,投票法则依据各个基础模型给出的概率分布按多数原则决定最终类别标签;而堆叠泛化则进一步引入元学习器来重新建模初级预测值之间的关系模式从而获得更加精细的结果判定标准[^3]。 #### 实验验证与性能评估 为了测试所提出的ensemble方法的有效性,在实际应用场景下选取公开可用的大规模数据库如PTB-XL来进行对比实验研究显得尤为重要。该类新型数据集不仅提供了丰富的样本数量还涵盖了详细的标注信息便于全面衡量算法的各项指标比如敏感度(Sensitivity)、特异性(Specificity)及F1分数等等[^3]。 ```python import numpy as np from sklearn.ensemble import VotingClassifier from tensorflow.keras.models import load_model # 加载已训练好的单个DL模型 model1 = load_model('path_to_model1.h5') model2 = load_model('path_to_model2.h5') def predict_with_ensemble(X_test): preds1 = model1.predict(X_test) preds2 = model2.predict(X_test) # 使用简单平均作为集成策略的一个例子 ensemble_preds = (preds1 + preds2) / 2 return ensemble_preds.argmax(axis=1) y_pred = predict_with_ensemble(X_test) ``` 以上代码片段展示了如何加载两个预先训练完成的不同结构类型的深度学习模型并通过简单的算术均值计算得到综合后的预测概率矩阵进而得出目标分类决策序列。 #### 结论 综上所述,借助深度学习驱动下的多模型集成方案能够极大地促进ECG心律失常检测任务向着更高精度方向迈进,同时为临床医生提供更为可靠的辅助诊疗手段支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值