Towards Robust Visual Question Answering: Making the Most of BiasedSamples via Contrastive Learning

走向鲁棒的视觉问题回答: 通过对比学习,最大限度地利用有偏样本

提出问题

       视觉问答(VQA)模型通常依赖于虚假的相关性,即语言先验。使得其在分布外(OOD)测试数据面前表现不好。最近的方法通过减少偏倚样本对模型训练的影响,在克服这个问题方面取得了一些进展。但是,其在分布外(OOD)测试数据的改进严重牺牲了分布(ID)数据(由偏置样本主导)上的性能。

解决方法和创新点

       提出了一种新颖的对比学习方法,MMBS。它通过充分利用有偏样本来构建鲁棒的VQA模型。

       具体来说,通过从原始训练样本中消除与语言先验相关的信息来构建用于对比学习的正样本,并探索出了几种策略来使用构建的正样本进行训练。这种方法没有破坏有偏样本在模型训练中的重要性,而是精确地利用有偏样本获得了有助于推理的无偏信息。

      在分布外(OOD)测试数据集VQA- CP v2上的性能很有竞争力,同时在分布(ID)数据集VQA v2上保持了稳定的性能。

方法

其中,问题类别词用黄色高亮显示。橙色圆圈和蓝色三角形表示原始样本和正样本的跨模态表示。同批次的其他样本为负样本,用灰色圆圈表示

MMBS模型构造:(1)一个骨干VQA模型;

                             (2)一个正样本构建模块;

                             (3)一个无偏样本选择模块;

                             (4)对比学习目标。

1.骨干VQA模型

       骨干VQA模型在MMBS中可以自由选择。大多数现有的VQA模型由四个部分组成:问题编码器eq(·)、图像编码器ev(·)、融合函数F(·)和分类器clf(·)。

        训练目标:最小化多标签软损失Lvqa,可以形式化如下:

2.正样本构造

      为了充分利用有偏样本中所包含的无偏信息,首先要构建排除有偏信息的正样本。

由于没有提供具体的参考引用内容,以下是一些基于一般性知识对《Towards Cost - Effective Learning: A Synergy of Semi - Supervised and Active Learning》可能涉及内容的推测。 该研究可能聚焦于如何将半监督学习和主动学习相结合以实现更具成本效益的学习方式。半监督学习利用大量未标记数据和少量标记数据进行学习,而主动学习则通过主动选择最有价值的数据进行标记来提高学习效率。二者结合可能在减少标记数据成本的同时,提升模型的性能和泛化能力。 在实际应用中,这种结合可能会用于图像识别、自然语言处理等领域,以在有限的资源下取得更好的学习效果。例如,在图像识别任务中,主动选择一些具有代表性的图像进行标记,然后结合大量未标记图像进行半监督学习,从而在不标记大量图像的情况下获得高精度的识别模型。 ```python # 这里简单模拟一个可能的主动学习和半监督学习结合的伪代码框架 # 假设我们有一些未标记数据和少量标记数据 unlabeled_data = [...] labeled_data = [...] # 主动学习选择最有价值的数据进行标记 def active_selection(unlabeled_data, model): # 选择最有价值的数据的逻辑 selected_data = ... return selected_data # 半监督学习更新模型 def semi_supervised_learning(model, labeled_data, unlabeled_data): # 半监督学习的训练逻辑 updated_model = ... return updated_model # 循环进行主动学习和半监督学习 model = ... for i in range(num_iterations): selected_data = active_selection(unlabeled_data, model) # 标记选择的数据 labeled_data.extend(selected_data) model = semi_supervised_learning(model, labeled_data, unlabeled_data) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值