特征融合这么做，竟能发Nature？！

最新推荐文章于 2025-06-01 19:34:47 发布

Ai墨芯111

最新推荐文章于 2025-06-01 19:34:47 发布

阅读量687

点赞数 26

文章标签： embedding java intellij-idea 目标跟踪 YOLO

本文链接：https://blog.youkuaiyun.com/Aimoxin111/article/details/146493956

版权

2025深度学习发论文&模型涨点之——特征融合

在数据处理的最早阶段，将不同来源或类型的特征合并在一起。例如，对于多模态数据（如图像和文本），在将图像数据转换为特征向量（如通过卷积神经网络提取的图像特征）和文本数据转换为特征向量（如通过词嵌入和循环神经网络提取的文本特征）之后，直接将这两个特征向量拼接在一起。

优点：能够充分利用不同模态数据之间的互补信息，模型可以学习到更丰富的特征表示。例如，在自动驾驶场景中，将车辆的传感器数据（如雷达数据和摄像头图像数据）进行早期融合，可以让车辆更准确地感知周围环境。
缺点：由于是在特征提取后的初步阶段进行融合，可能会导致融合后的特征维度过高，增加模型的计算复杂度。而且如果不同模态数据的特征提取方法不够准确，融合后的特征可能会受到“污染”。

小编整理了一些特征融合【论文】合集，以下放出部分，全部论文PDF版皆可领取。

需要的同学扫码添加我

回复“特征融合”即可全部领取

论文精选

论文1：

HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical Image Classification

HiFuse：用于医学图像分类的层次多尺度特征融合网络

方法

创新点

融合CNN和Transformer优势：结合CNN的局部特征提取能力和Transformer的全局语义建模能力，显著提升医学图像分类性能。

层次多尺度特征融合：通过HFF块融合不同尺度的局部和全局特征，全面挖掘病变区域的深浅和全局局部特征，提升分类精度。

性能提升：在ISIC2018、Covid-19和Kvasir数据集上，HiFuse模型的准确率分别比基线提高了7.6%、21.5%和10.4%，优于其他先进模型。

论文2：

Multi-interactive Feature Learning and a Full-time Multi-modality Benchmark for Image Fusion and Segmentation

多交互特征学习和全天时多模态基准测试用于图像融合与分割

方法

创新点

论文3：

SecondPose: SE(3)-Consistent Dual-Stream Feature Fusion for Category-Level Pose Estimation

SecondPose：用于类别级姿态估计的SE(3)一致性双流特征融合

方法

创新点

融合语义与几何特征：首次将DINOv2的语义特征与几何特征融合，提升类别级姿态估计性能。

SE(3)一致性表示：通过几何特征对齐，建立SE(3)变换下一致的对象表示，简化姿态估计过程，提升准确性和效率。

性能提升：在NOCS-REAL275数据集上，SecondPose的平均精度（mAP）比之前最佳方法提升了12.4%，在HouseCat6D数据集上也大幅领先。

论文4：

Time-space-frequency feature Fusion for 3-channel motor imagery classification

3通道运动想象分类的时间-空间-频率特征融合

方法

创新点

多模态特征融合：提出TSFF-Net，融合时间-空间-频率特征，弥补单一模态特征提取网络的不足。

轻量级网络设计：TSFF-img网络轻量且浅层，适合从EEG时间-频率谱图中提取特征，性能优于AlexNet、VGG和ResNet。

性能提升：在BCI4-2A和BCI4-2B数据集上，TSFF-Net的分类准确率高于其他先进方法，仅用3个通道就超过部分基于22个通道的方法。