DCN-T: Dual Context Network with Transformer for Hyperspectral Image Classification

二三两。

于 2024-07-31 21:01:01 发布

阅读量1.1k

点赞数 25

分类专栏：论文解读文章标签： transformer 深度学习人工智能图像处理计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_47182555/article/details/140749517

版权

1引言

本文主要是对《DCN-T: Dual Context Network with Transformer for Hyperspectral Image Classification》这篇论文的一个解读与总结，原文链接：DCN-T: Dual Context Network With Transformer for Hyperspectral Image Classification | IEEE Journals & Magazine | IEEE Xplore

本篇论文是对高光谱图像分类的一个模型设计。作者采用了一个端对端的DCN-T（双分支上下文网络）对图像进行分割分类。首先将高光谱图像转换为三光谱图像，从而可以使用现成的ImageNet预训练骨干网络进行特征提取。接着采用DCM（双分支模型）提取区域适应上下文（RAC）特征和全局聚合上下文（GAC）特征进行融合得到包含全局局部信息的特征。再采用软分类的方式得到各个类别的概率，得到分类结果。最后总的损失函数包括结果预测损失和辅助损失，两者采用交叉熵损失函数计算损失值。

2 现已有研究存在的问题

高光谱图像（HSI）存在“空间变异性”，同一对象在不同的地域环境下表现出不同的特征，由此产生混合类别的问题导致类间相似性，从而增加分类难度。

为了解决这一问题，提取重要的判别特征，现有的许多网络模型在大规模数据集（如ImageNet）上进行预训练，使用预训练权重来增加深度网络的性能和收敛的有效性。

然而由于自然图像和高光谱图像之间的通道数存在差异，这些网络不能直接用于高光谱图像的分类。因此现有的许多方法都是采用将高光谱图像转换为三光谱图像进行处理，但是由于高光谱图像含有丰富的光谱信息，这将导致大量的光谱信息的损失。

同时由于高光谱图像含有丰富的光谱信息，光谱维度很高，随机选择三通道进行组合会生成一个庞大的三光谱图像集合，进而再采用集合方式进行评估时将会引入巨大的计算负担，这在实践中是不可行的。

3 模型架构

3.1 三光谱图像的生成

三光谱图像生成管道包括三步：分组和聚合、随机通道选择、图像拉伸。

3.1.1 分组和聚合

① 分组

因为相邻的通道具有高度相关性，因此我们采用沿着光谱方向进行划分而不是随机分组。

原始图像 $X_{HSI}=\left \{ x_{1},\cdots ,x_{L} \right \}\epsilon \mathbb{R}^{H\times W\times L}$ ，将图像沿光谱方向分为 $G$ 组，

得到 $X_{HSI}=\left \{ X_{1},\cdots ,X_{G} \right \}$ 。

其中每一组可以表示为 $X_{i}=\left \{ x_{(i-1)\frac{L}{G}+1} ,\cdots ,x_{i\cdot \frac{L}{G}}\right \},i\epsilon \left ( 1,G \right )$ 。

② 聚合

通过平均值聚合每组内的通道得到新的通道作为三光谱图像中的一维。

公式如下：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

二三两。 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。