
灵感论文阅读
文章平均质量分 56
prinTao
我是prinTao,计算机视觉与机器人方向。欢迎关注我,一起学习CV~
展开
-
【论文阅读】**Cross-Modality depth Estimation via Unsupervised Stereo RGB-to-infrared Translation**
深度估计是许多计算机视觉应用的一项基本任务[1]、[2]、[3]。随着CNN的发展,许多算法进一步提高了深度估计的性能。主流方法是从立体图像估计场景深度。根据训练方式的不同,监督方法[4]、[5]、[6]使用真实视差图直接指导训练,而无监督方法[7]、[8]、[9]将深度估计重新表述为利用立体关系作为监督来辅助训练的图像重建问题。一般来说,大多数现有方法[ 4,5,6,10,11,7,8,9,12,13 ]仅使用可见光(RGB )图像进行估计。原创 2024-02-22 15:43:26 · 955 阅读 · 0 评论 -
【多传感器攻击】TPatch: A Triggered Physical Adversarial Patch
我们还讨论了传感器、算法和系统级别的可能防御措施。然后,为了找到可行的正触发,该模块估计由物理信号引起的图像失真,并使用提出的理论模型对失真进行正则化。2 然后,面向触发的补丁优化模块根据选定的正触发和负触发设计损失函数,通过梯度优化生成能够实现相应攻击目标的TPatch。3 基于内容的伪装模块通过使用预训练的特征提取器应用从参考图像中提取的有意义的内容,进一步提高了TPatch的视觉隐形性。4 现实世界鲁棒性改进模块通过解决贴片的变形和触发信号的误差来提高TPatch在现实世界中的鲁棒性。原创 2024-01-08 15:44:14 · 563 阅读 · 0 评论 -
【每日论文阅读】Do Perceptually Aligned Gradients Imply Robustness?
对抗性鲁棒分类器具有非鲁棒模型所没有的特征——感知对齐梯度(PAG)。一些研究已将 PAG 确定为稳健训练的副产品,但没有一篇研究将其视为一种独立现象,也没有研究其自身的影响。为此,我们制定了一个新的目标,在训练分类器中直接推广 PAG,并检查具有此类梯度的模型是否对对抗性攻击更稳健。对多个数据集和架构的大量实验验证了具有对齐梯度的模型表现出显着的鲁棒性,揭示了 PAG 和鲁棒性之间令人惊讶的双向联系。最后,我们表明更好的梯度对齐可以提高鲁棒性,并利用这一观察结果来提高现有对抗训练技术的鲁棒性。原创 2024-01-08 14:13:40 · 722 阅读 · 0 评论 -
数据集搜索网址汇总
minehttps://toolbox.google.com/datasetsearchhttps://github.com/awesomedata/awesome-public-datasetshttp://www.cvpapers.com/datasets.htmlhttps://github.com/jbhuang0604/awesome-computer-vision#datasetshttps://small-obstacle-dataset.github.io/outdatase原创 2022-01-14 16:08:25 · 3191 阅读 · 0 评论 -
inception系列总结
inception系列:Well-Designed OR Delicate摘要2014年GoogleNet(Inception v1)诞生开始,Google差不多保持一年一更的节奏,陆续推出了BN-Inception [2015-2],Inception v2和v3 [2015-7],Inception v4和Inception-ResNet [2016]。由于其优秀的性能,在各个数据集都达到过SOTA的精确度。同时,其系列模型都提出了很多训练技巧、模型设计技巧,大幅促进了深度学习的发展。然而,随着原创 2021-11-02 00:00:16 · 928 阅读 · 3 评论 -
PVT:Pyramid Vision Transformer 能接受高分图像的Transformer骨干网
参考资料https://blog.youkuaiyun.com/weixin_44966641/article/details/118733341http://jalammar.github.io/illustrated-transformer/https://www.cnblogs.com/jins-note/p/14815511.htmlTransformer结构Encoder-DecoderTransformer结构可以表示为Encoder和Decoder两个部分。Encoder和Decoder主要由原创 2021-10-19 22:51:33 · 291 阅读 · 0 评论 -
Person Search Challenges and Solutions: A Survey 基于文本的行人搜索 综述
Person Search Challenges and Solutions: A Survey摘要介绍Person Search深度特征表征学习Deep Metric Learning身份驱动检测工作总结和未来的方向多模态人物搜索。基于属性的人物搜索方法基于文本的人员搜索本质上是一个零概率学习问题结论摘要人身搜索由于其在现实世界中的应用和研究意义而受到越来越多的关注。人物搜索的目的是在一组场景图像中找到一个被调查的人,这些图像应用广泛,如罪犯搜索、多相机跟踪、失踪人员搜索等。早期的人物搜索工作主要集中原创 2021-10-12 23:10:11 · 1243 阅读 · 0 评论 -
ViT: 图像理解为16X16单词组套用Transformer模型-2020.10
BKGAttentonAttention is all u needTransformer in NLPRaw artical原创 2021-10-12 22:04:00 · 165 阅读 · 0 评论 -
卷积核设计
奇数卷积核和偶数卷积核“Convolution with even-sized kernels and symmetric padding” 这篇论文,解释了偶数卷积核对网络的影原创 2021-10-12 20:53:30 · 515 阅读 · 0 评论 -
SENet
原作者采访原创 2021-10-12 20:49:32 · 122 阅读 · 0 评论 -
Deep Gait Recognition: A Survey
摘要基于深度学习的步态识别方法已经成为该领域的主流技术,并促进了现实世界的应用。在本文中,我们全面概述了深度学习步态识别的突破和最新发展,并涵盖了广泛的主题,包括数据集,测试协议,最新的解决方案,挑战和未来的研究方向。我们首先回顾了常用的步态数据集以及评价它们的原则。然后,我们提出了一种 新的分类方法,由四个独立的维度组成,即身体表征、时间表征、特征表征和神经结构,以帮助描述和组织该领域的研究景观和文献。根据我们提出的分类方法,一个全面的调查,步态识别方法使用深度学习,并讨论了它们的性能,特点,优势和原创 2021-10-09 23:44:44 · 646 阅读 · 0 评论