目的
之前阅读了AAAI2020 Deep Embedded Complementary and Interactive Information for Multi-view Classification这篇文章并做了阅读笔记,但是这是一个用于单标签任务的模型,出于用来做对比实验的目的欲把它改成了多标签模型,下面开始。
基础
先观察模型结构如下图

聚焦到模型最后的预测结果并融合的部分,观察源码发现最后的分类部分就是简单的全连接层,而且因为是多分类问题所以随后输出层有num_classes个节点。
self.classifier_out = nn.Sequential(
nn.Linear(num_view * fea_out, fea_com),
nn.BatchNorm1d(fea_com),
nn.ReLU(inplace=True),
nn.Dropout(),
nn.Linear(fea_com, num_classes),
nn.BatchNorm1d(num_classes)
)
那么最简单的更改方法来啦,模型不用动,把loss从nn.CrossEntropyLoss()</

本文介绍了如何将AAAI2020论文中的Deep Embedded Complementary and Interactive Information for Multi-view Classification模型应用于多标签任务。通过简单修改损失函数和权重计算,实现了模型的转化。进阶部分提出了使用BR思想,为每个标签设置独立的视图融合权重,并探讨了进一步改进的可能性,即为每个标签单独训练分类网络,但考虑到计算成本和创新点的保留,这可能并非最优解决方案。
最低0.47元/天 解锁文章
1138

被折叠的 条评论
为什么被折叠?



