
算法
文章平均质量分 92
酉意铭
深度学习 计算机视觉
展开
-
Swin Transformer:Hierarchical Vision Transformer using Shifted Windows (论文阅读笔记)
swin transformer 是微软亚研院胡瀚老师与2021年提出,发表在ICCV上并获得best paper 和马尔奖。是基于transformer的backbone网络,屠榜各大视觉任务。论文链接:https://arxiv.org/abs/2103.14030代码链接:https://github.com/microsoft/Swin-Transformer摘要 本文介绍了一种称为 Swin Transformer 的新视觉 Transformer,它可以作为计算机视觉的...原创 2021-12-25 22:59:42 · 4188 阅读 · 0 评论 -
ViT ——AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(论文阅读笔记)
ViT 是Google团队于2021年发表在ICLR上的paper,论文链接:https://arxiv.org/abs/2010.11929摘要 虽然 Transformer 架构已成为自然语言处理任务事实上的标准,但其在计算机视觉中的应用仍然有限。 在视觉中,注意力要么与卷积网络结合使用,要么用于替换卷积网络的某些组件,同时保持其整体结构不变。 我们表明,这种对 CNN 的依赖是不必要的,直接应用于图像块序列的纯transformer可以在图像分类任务上表现得非常好。 当在大量数...原创 2021-11-21 19:35:59 · 3235 阅读 · 0 评论 -
PointNet 论文阅读笔记
摘要 点云是几何数据结构的一种重要类型。 由于格式不规则,大多数研究人员将此类数据转换为规则的3D voxel网格或图像集合。 但是,这使数据变得不必要地庞大,并导致了问题。 在本文中,我们设计了一种直接消耗(consume)点云的新型神经网络,该网络很好地考虑了输入中点的排列不变性。 我们的网络名为PointNet,为从目标分类,分割,到场景语义解析的应用程序提供了统一的体系结构。 虽然很简单,但PointNet高效且高效。 从经验上讲,它表现出同等甚至优于现有技术的强大性能。 从理论上讲,我...原创 2021-06-09 20:57:00 · 970 阅读 · 0 评论 -
FCOS:Fully Convolutional One-Stage Object Detection(论文阅读笔记)
本文是CVPR2019 的文章,基于Anchor-free。论文链接:https://arxiv.org/abs/1904.01355代码链接:当前mmdetection中有focs的相关code实现。摘要: 我们提出了一种全卷积的单阶段目标检测器(FCOS),以按像素预测的方式来解决目标检测,类似于语义分割。几乎所有最新的物体检测器(例如RetinaNet,SSD,YOLOv3和Faster R-CNN)都依赖于预定义的anchor box。相反,我们提出的检测器FCOS不含a...原创 2021-04-24 16:51:50 · 612 阅读 · 0 评论 -
FaceNet: A Unified Embedding for Face Recognition and Clustering(论文阅读笔记)
论文中一个很重要的贡献是提出了triplet loss论文链接:https://arxiv.org/abs/1503.03832摘要 尽管人脸识别领域最近取得了重大进展[10,14,15,17],但大规模高效地实现人脸验证和识别对现有方法提出了严峻挑战。在这篇论文中,我们提出了一个叫做FaceNet的系统,它可以直接从人脸图像学习到一个紧凑的欧几里德空间的映射,其中距离直接对应于...原创 2019-07-07 15:50:41 · 7296 阅读 · 0 评论 -
OSNet:Omni-Scale Feature Learning for Person Re-Identification(论文阅读笔记)
CVPR 2019的文章,作者自己根据Reid任务重新设计了一种新的网络结构,比较轻便,对比shuffleNet,mobileNet,SqueezeNet等具有更好的性能。论文链接:《Omni-Scale Feature Learning for Person Re-Identification》代码链接:https://github.com/KaiyangZhou/deep-person...原创 2019-06-27 11:27:54 · 17881 阅读 · 9 评论 -
Bag of Tricks and A Strong Baseline for Deep Person Re-identification(论文阅读笔记)
本文是CVPR2019 的文章,作者给出了一个很强的人体ReID baseline模型,文中包含了许多ReID训练技巧并提出一种BNNeck,在Market1500和DukeMTMC-ReID 两个数据集上达到了目前最好的Rank-1 精度和mAP。论文链接:《Bag of Tricks and A Strong Baseline for Deep Person Re-identificati...原创 2019-06-27 17:16:27 · 12797 阅读 · 5 评论 -
BFENet:Batch Feature Erasing for Person Re-identification and Beyond(网络阅读笔记)
论文连接:《Batch Feature Erasing for Person Re-identification and Beyond》代码链接:https://github.com/daizuozhuo/batch-feature-erasing-network摘要 本文提出了一种新的训练机制——批特征擦除(BFE),用于行人再识别。应用该策略,以ResNet-50为ba...原创 2019-06-29 21:21:52 · 4372 阅读 · 2 评论 -
PCB:Beyond Part Models: Person Retrieval with Refined Part Pooling(论文阅读笔记)
ECCV2018年的论文论文原文:原文链接本文是阅读的arXiv上的论文,与发表在ECCV2018上的原文细微差别。arXiv 链接:arXiv 论文链接摘要 在行人图像描述中使用 part-level 特征提供了细粒度的信息,并在最近的文献中被证实对人的检索是有益的。part发现的一个先决条件是每个 part 都要定位好。本文不采用姿态估计等外部线索直接定位 pa...原创 2019-07-05 19:45:50 · 2241 阅读 · 0 评论 -
Center Loss: A Discriminative Feature Learning Approach for Deep Face Recognition(论文阅读笔记)
摘要 卷积神经网络(CNNs)在计算机视觉领域得到了广泛的应用,极大地提高了计算机视觉领域的技术水平。在现有的神经网络中,大多采用softmax损失作为监督信号来训练模型。为了提高对深度学习特征的识别能力,提出了一种新的人脸识别监控信号——center loss。具体来说,center loss同时学习每个类的深度特征中心,并惩罚深度特征与其对应的类中心之间的距离。更重要的是,我们证明了...原创 2019-07-23 17:28:02 · 3843 阅读 · 0 评论 -
DenseNet:Densely Connected Convolutional Networks(论文阅读笔记)
论文链接:《Densely Connected Convolutional Networks》代码链接:https://github.com/liuzhuang13/DenseNet摘要 最近的研究表明,如果卷积网络包含接近输入层和接近输出层之间较短的连接,那么训练卷积网络将会更加深入、准确和有效。在本文中,我们接受了这一观察,并引入了Dense Convolutional Net...原创 2019-07-30 15:19:57 · 1914 阅读 · 0 评论 -
RetinaFace: Single-stage Dense Face Localisation in the Wild(论文阅读笔记)
摘要 虽然在不受控制的人脸检测方面已经取得了巨大的进步,但是在wilder上准确有效的人脸定位仍然是一个公开的挑战。本文提出了一种鲁棒的single stage人脸检测器RetinaFace,它利用联合的额外监督和自监督多任务学习的优点,对不同尺度的人脸进行像素级定位。具体来说,我们在以下五个方面做出了贡献:(1)我们在WILDER FACE数据集中手工标注了5个人脸Landmark,并...原创 2019-07-30 20:06:05 · 3803 阅读 · 0 评论 -
BP反向传播详细推导
BP神经网络是反向传播算法,他是一个非线性的前馈神经网络。由于网络参数需要更新,反向指的是参数梯度的反向传播,输入向前传播。非线性是因为神经元的激活函数是一个非线性可导的sigmoid函数。先来看看神经元的激活函数,即sigmoid函数: 该函数的特点是:...原创 2019-08-04 16:52:25 · 1298 阅读 · 0 评论 -
CNN中的参数,计算量,FLOPs,Multi-Add(乘加),输出特征图尺寸等概念详解
在阅读论文时,我们会遇到参数量,FLOPS,Multi-add, CNN参数,CNN计算量等概念,通过阅读整理,这篇博客希望以最简洁的解释帮助大家理解这些基本概念。首先,我们看一下卷积的计算方式:卷积的计算方式:图片来自http://cs231n.github.io/convolutional-networks/卷积的计算方式上图描述了一个 5*5*3 的输入特征图边界采用1个...原创 2019-08-01 15:18:57 · 10159 阅读 · 7 评论 -
Triplet Loss 和 Center Loss详解和pytorch实现
最近在学习ReID相关的算法,为了提高ReID的性能通常会采用softmax loss 联合 Triplet Loss和Center Loss来提高算法的性能。本文对Triplet Loss和Cnetr Loss做一个总结,以简洁的方式帮助理解。Triplet Loss和Center Loss都是从人脸识别领域里面提出来的,后面在各种图像检索任务中被广泛应用。想要了解Triplet L...原创 2019-08-01 16:44:41 · 31610 阅读 · 3 评论 -
FA-RPN: Floating Region Proposals for Face Detection(论文阅读笔记)
2019年的CVPR论文:《FA-RPN: Floating Region Proposals for Face Detection》论文链接:https://arxiv.org/abs/1812.05586摘要 本文提出了一种新的人脸检测region proposals生成方法。我们没有使用卷积特征图中的像素特征对anchor boxes进行分类,而是采用基于池化的方...原创 2019-06-25 18:49:31 · 2639 阅读 · 0 评论 -
AInnoFace:Accurate Face Detection for High Performance(论文阅读笔记)
摘要 随着深度卷积神经网络(CNNs)的发展,人脸检测技术得到了长足的发展。如何提高微小人脸的检测性能是近年来研究的核心问题。为此,近年来的许多工作提出了一些具体的策略,重新设计了体系结构,并引入了新的用于微小目标检测的损失函数。在这篇报道中,我们从流行的单阶段RetinaNet[20]方法开始,应用一些最新的技巧来获得高性能的人脸检测器,即AInnoFace。具体来说,我们应用IoU损失...原创 2019-06-19 18:19:19 · 2492 阅读 · 1 评论 -
人脸检测算法:PyramidBox++(论文阅读笔记)
论文:《PyramidBox++: High Performance Detector for Finding Tiny Face》原文链接:https://arxiv.org/abs/1904.00386PyramidBox的改进版本,见我之前的博客:https://blog.youkuaiyun.com/weixin_40671425/article/details/89299953先放上效果...原创 2019-05-23 16:38:06 · 3155 阅读 · 0 评论 -
两个排序数组的中位数
题目描述给定两个大小为 m 和 n 的有序数组 nums1 和 nums2 。请找出这两个有序数组的中位数。要求算法的时间复杂度为 O(log (m+n)) 。你可以假设 nums1 和 nums2 不同时为空。示例 1:nums1 = [1, 3]nums2 = [2]中位数是 2.0示例 2:nums1 = [1, 2]nums2 = [3, 4]中...原创 2018-09-08 15:02:22 · 197 阅读 · 0 评论 -
合并两个有序链表
题目描述将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例:输入:1->2->4, 1->3->4输出:1->1->2->3->4->4 /** * Definition for singly-linked list. * struct ListNode { * ...原创 2018-09-09 09:44:51 · 119 阅读 · 0 评论 -
实现两个链表的加和
题目描述给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。示例:给定一个链表: 1->2->3->4->5, 和 n = 2.当删除了倒数第二个节点后,链表变为 1->2->3->5.说明:给定的 n 保证是有效的。/** * Definition for singly-linked list. * ...原创 2018-09-10 13:11:59 · 221 阅读 · 0 评论 -
有效的括号
题目描述给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效。有效字符串需满足:左括号必须用相同类型的右括号闭合。 左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。示例 1:输入: "()"输出: true示例 2:输入: "()[]{}"输出: true示例 3:输入: "(]"输出: ...转载 2018-09-10 22:21:26 · 206 阅读 · 0 评论 -
C语言实现快速排序
思想:快速排序首先任意选取一个数据元素(通常是用数组的第一个元素)作为基准数,然后将所有比他小的数都放到他的前面,所有比他大的数放在他的后面。应当注意的是:快速排序算法是一种不稳定的排序算法,也就是说,当出数组中出现多个相同的的值,他们的位置可能会相对数组中的原始位置发生改变。 一趟快速排序的过程如下:1,设置两个变量 i,j,刚开始的时候,i = 0,j = N - 1;...翻译 2018-10-12 11:40:06 · 249 阅读 · 0 评论 -
二分查找-返回查找值第一次出现的下标
对于一个有序数组,我们通常采用二分查找的方式来定位某一元素,请编写二分查找的算法,在数组中查找指定元素。给定一个整数数组A及它的大小n,同时给定要查找的元素val,请返回它在数组中的位置(从0开始),若不存在该元素,返回-1。若该元素出现多次,请返回第一次出现的位置。测试样例:[1,3,5,7,9],5,3返回:1class BinarySearch {public:...原创 2019-03-13 11:45:36 · 1965 阅读 · 2 评论 -
FaceBoxes论文阅读
论文:FaceBoxes: A CPU Real-time Face Detector with High Accuracy原文链接:原文链接Faceboxes是一个实时人脸检测算法,在CPU上也能够达到20FPS,而且速度性能比较稳定,与人脸数量无关。1,引言 为了检测人脸检测速度问题,我们提出了一个新的人脸检测器,faceBoxes,在速度和准确率上都得到了很好的性...原创 2019-05-08 11:52:14 · 1199 阅读 · 0 评论 -
人脸检测之DSFD算法——论文翻译(DSFD: Dual Shot Face Detector)
论文:DSFD: Dual Shot Face Detector原文链接:https://arxiv.org/abs/1810.10220DSFD是2019年的人脸检测算法,来自腾讯优图实验室先看看算法的效果,在各个场景下都能达到非常好的人脸检测效果摘要: 本文提出了一个新的人脸检测网络-DSFD,DSFD计继承了SSD的网络结构,并引入了一个特征增强模块来转换原...原创 2019-04-25 18:04:15 · 5680 阅读 · 1 评论 -
PyramidBox:A Context-assisted Single Shot Face Detector(论文阅读笔记)
论文:PyramidBox: A Context-assisted Single Shot Face Detector原文链接:https://arxiv.org/abs/1803.07737?context=csPyramidBox是2018年的人脸检测冠军方案先上一个效果图,该图据报道有1000人,PyramidBox人脸检测器检测到了880张人脸,图片右侧的颜色条表示检测置信度,可...原创 2019-04-14 21:17:47 · 3661 阅读 · 0 评论 -
S3FD论文阅读笔记
论文:《S3FD: Single Shot Scale-invariant Face Detector》原文链接:https://arxiv.org/abs/1708.05237代码链接:https://github.com/sfzhang15/SFD摘要 本文提出了一种基于single-shot尺度不变的人脸实时检测方法,该方法在各种尺度的人脸检测中都具有良好的性能,尤其是...原创 2019-05-14 15:59:47 · 844 阅读 · 0 评论 -
SSH人脸检测算法(SSH: Single Stage Headless Face Detector)
论文:《SSH: Single Stage Headless Face Detector》链接:https://arxiv.org/pdf/1708.03979.pdf代码链接:https://github.com/mahyarnajibi/SSH摘要 我们介绍了单点无头(SSH)人脸检测器。与两阶段提议分类检测器不同,SSH直接从分类网络中的早期卷积层以单阶段方式检测...原创 2019-05-21 15:39:36 · 4538 阅读 · 2 评论 -
CornerNet论文阅读整理
论文:《CornerNet: Detecting Objects as Paired Keypoints》原文链接:https://arxiv.org/abs/1808.01244代码链接:https://github.com/princeton-vl/CornerNet摘要 我们提出了CornerNet,这是一种新的目标检测方法,我们使用一个卷积神经网络将一个目标边界框检...原创 2019-05-12 22:05:38 · 6680 阅读 · 4 评论 -
MTCNN:人脸检测对齐算法——多任务级联卷积网络(论文阅读笔记)
论文:《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》原文链接:https://kpzhang93.github.io/MTCNN_face_detection_alignment/paper/spl.pdf摘要 由于各种姿态、光照和遮挡,在无约束环境...原创 2019-05-23 11:46:08 · 1553 阅读 · 0 评论 -
计算无重复字符的最长子串
题目描述:给定一个字符串,找出不含有重复字符的最长子串的长度。示例 1:输入: "abcabcbb"输出: 3 解释: 无重复字符的最长子串是 "abc",其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 无重复字符的最长子串是 "b",其长度为 1。示例 3:输入: "pwwkew"输出: 3解释: 无重复字符的最长子串是 "wk.原创 2018-09-08 14:00:06 · 208 阅读 · 0 评论