- 博客(7)
- 收藏
- 关注
原创 通用域自适应(Universal Domian Adaptation)
在UDA中,给定一个标记的源领域,对于任何相关的目标领域,无论其标签集与源领域的标签集有何不同,如果目标领域的样本属于源标签集中的任何一类,我们都需要正确分类它,否则将其标记为“未知”。然而,在通用领域适应中,这种直接的方法可能会失效,因为由于潜在的领域差异,神经网络的预测往往过于自信[10]但区分度较低。(3)我们提出了通用适应网络(UAN),这是一种端到端的解决方案,它利用每个样本的领域相似性和预测不确定性来开发一种加权机制,以发现两个域共享的标签集并促进共同类别的适应。
2024-05-25 17:22:41
1565
原创 Domain Adaptation(领域自适应)
我们可以训练一个在source domain 上难免表现很出色的模型,但是当target domian和source domain的数据分布不一样时候,我们之前在source domian上面训练的模型,在target domain上面表现可能不是很好。其中绿色长方形的代表我们从source domain和target domain提取的特征图(特征向量),我们要求来自两张图片(source domain 和target domain)出现的数据点(红色点和蓝色点)分布应该看起来一样,分不出差异。
2024-05-25 11:16:24
1023
原创 TransGeo(论文阅读)
论文大概:本文充分利用了transformer的全局信息建模和显著位置编码优势,并利用注意力引导的非均匀编码技术对图像的无用信息进行了去除,保留了有用信息,进而可以使多余的计算成本用于计算高分辨率的图像,实验表明,我们在城市和农村的数据集上都达到了sota水准。代码:https: //github.com/Jeff-Zilence/TransGeo2022.由于本人之前已经读过这篇论文,因此下面直接开始代码实战。
2024-05-22 23:50:56
266
3
原创 语义图像检索
检索过程:提取输入的ROI区域的resnet101的cnn特征,该描述符经过分类器识别概念节点,然后返回初始的概念集,这些概念集会出现在查询区域当中,然后用户通过在线交互修改初始返回的概念列表。最后,使用CBIR(基于内容的图像检索)根据相似度对检测到的子节点所属的图像进行排序,以形成检索结果,流程如图2所示。我们的方法包含多个步骤:使用高级语义分割进行ROI区域的提取,使用CNN描述符进行ROI的表示,高效的数据库组织形式,查询区域中的概念(节点)和子节点,使用CBIR检测子节点的排名。
2024-05-18 12:04:54
654
原创 语义引导的特征检测和描述
视觉定位在自动驾驶和机器人领域的基础任务。过去的工作只在提取大量丰富的局部可靠特征,然而在具有挑战性的大范围环境中,局部特征的有效性和准确性会受到限制。与之前的工作不同,我们提出来一种通过隐式地讲语义信息编码到特征检测和描述过程中的全局可靠特征提取方法。具体而言:我们的语义感知检测器能够从可靠区域(如建筑物、交通车道)中检测图像关键点,并隐式抑制不可靠区域(如天空、车辆等),而不是依赖于显式的语义标签。我们的方法通过减少对外观变化敏感的特征数量和避免在测试过程中需要额外的语义分割网络提高了关键点匹配的准确率
2024-05-11 12:23:30
660
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人