- 博客(71)
- 资源 (32)
- 收藏
- 关注

原创 视频理解资源汇总----持续更新
综述类视频理解研究https://blog.youkuaiyun.com/jiafeier_555/article/details/85062458计算机视觉视频理解领域的经典方法和最新成果https://baijiahao.baidu.com/s?id=1601681842694561210&wfr=spider&for=pcVisualData----计算机视觉数据集网站htt...
2020-04-20 16:41:02
1339

原创 图像分类资源汇总----持续跟新
①ResNet最强改进版来了!ResNeSt:分散-注意力网络ResNeSt-50在ImageNet上实现了81.13%的top-1,简单地用ResNeSt-50替换ResNet-50,可以将MS-COCO上的FasterRCNN的mAP从38.5%提高到41.4%!代码现已开源!作者团队:亚马逊(张航和李沐等)&UC Davis尽管图像分类模型最近不断发展,但是由于其简单而模块化的结...
2020-04-17 18:41:38
2726

原创 目标检测资源汇总--持续更新
①实战项目 支持剪枝、量化和知识蒸馏的YOLOV3【特性】1、提供多个主流目标检测数据集的预处理后文件及训练方法。2、提供包括剪枝,量化,知识蒸馏的主流模型压缩算法实现。3、提供多backbone训练目前包括Darknet-YOLOv3,Tiny-YOLOv3,Mobilenetv3-YOLOv3。【目前支持功能】正常训练tiny训练mobilenetv3训练Dior数据集训练...
2020-04-05 14:37:05
4420
4

原创 文本检测与识别(OCR)资源汇总(持续更新)
1.什么是OCR文字识别https://zhuanlan.zhihu.com/p/950023612.身份证OCR识别https://zhuanlan.zhihu.com/p/1051892633.OCR图像预处理小结https://zhuanlan.zhihu.com/p/583643884.自然场景OCR任务取得技术突破https://zhuanlan.zhihu.com/p/50521...
2020-02-17 14:16:28
5052

原创 解答如何刷leetcode--------方法决定你的效率
解答如何刷leetcode--------方法决定你的效率在看了一些知乎和牛客上的帖子以及《王道程序员面试宝典》,我确定了我的刷题方法,就是分知识点,按难易程度开始刷。下面分享一些我看到的刷题攻略:1.按照下面的tag刷起来挺好的。比如复习链表的内容,就选Linked List这部分的23个题目。刷完之后可以再总结一下常用的方法和数据结构构造方式。—tag的顺序我是按《王道》里面的顺序(附...
2019-10-24 21:08:30
1162
12

原创 1024---程序猿节,我开始重新更博,重获新生!
人的每一个成长节点都需要反思和求变做完天池农业大赛以及老师布置的项目后,我依然每天进行着9117的学习,但是感觉每天虽然忙忙碌碌,却没有什么规划,感觉效率不高。为了求变,我在两天前给自己定了一个计划,如下:未来会继续更博,包括比赛,编程还有手撕统计学习,现在每天按着计划学习,感觉挺有劲的。多学习,多总结,多进步,共勉。...
2019-10-24 17:45:29
239
1
原创 (六)CRAFT----2019CVPR论文解读
Character Region Awareness for Text DetectionAbstract近年来出现了基于神经网络的场景文本检测方法,并取得了良好的效果。以前使用刚性词级边界框训练的方法在以任意形状表示文本区域方面表现出局限性。本文提出了一种新的场景文本检测方法,通过挖掘每个字符和字符之间的亲和度来有效地检测文本区域。为了克服单个字符级标注的不足,我们提出的框架既利用了给定的合...
2020-02-19 14:21:02
2828
原创 (五)PSENet----2019CVPR论文解读
Shape Robust Text Detection with Progressive Scale Expansion Network基于渐进式尺度扩展网络的形状稳健文本检测Abstract近年来,随着卷积神经网络的发展,场景文本检测技术取得了长足的进步。然而,仍然存在两个挑战,阻碍了该算法进入工业应用。一方面,目前的大多数算法对任意形状的文本定位都需要四边形的包围盒,而四边形包围盒的定位...
2020-02-19 11:26:30
2945
原创 (四)EAST----2017CVPR论文解读
EAST: An Efficient and Accurate Scene Text DetectorEAST:一种高效准确的场景文本检测器Abstract以往的场景文本检测方法已经在各种基准测试中取得了良好的性能。然而,即使配备了深度神经网络模型,它们在处理具有挑战性的场景时通常也达不到要求,因为整体性能是由管道中多个阶段和组件的相互作用决定的。在这项工作中,我们提出了一种简单而强大的流水...
2020-02-18 16:39:58
1711
1
原创 (三)SegLink----2017ECCV论文解读
Detecting Oriented Text in Natural Images by Linking Segments利用链接段检测自然图像中的定向文本Abstract大多数最先进的文本检测方法都是专门针对水平拉丁文文本的,对于实时应用来说速度不够快。介绍了一种面向文本的文本检测方法–分段链接(SegLink)。其主要思想是将文本分解成两个局部可检测的元素,即片段和链接。段是覆盖部分单词...
2020-02-18 13:15:17
1090
原创 (二)CTPN----2016ECCV论文解读
Detecting Text in Natural Image with Connectionist Text Proposal Network用连接文本提案网络检测自然图像中的文本摘要我们提出了一种新颖的连接文本提议网络(CTPN),它能够准确定位自然图像中的文本行。CTPN直接在卷积特征映射中的一系列细粒度文本提议中检测文本行。我们开发了一个垂直锚点机制,联合预测每个固定宽度提议的位置和...
2020-02-18 01:05:47
1255
原创 (一)CRNN----2015CVPR论文解读
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition基于图像序列识别的端到端可训练神经网络及其在场景文本识别中的应用Abstract基于图像的序列识别一直是计算机视觉中长期存在的研究课题。在本文中,我们研...
2020-02-17 22:12:17
3486
原创 (五)MobileNet_v3----2019ICCV论文解读
Searching for MobileNetV3Abstract我们将结合互补的搜索技术以及新颖的体系结构设计,展示下一代MobileNets。通过结合NetAdapt算法的硬件感知网络架构搜索(NAS),将MobileNetV3调整到手机CPU,然后通过新颖的架构改进对其进行改进。本文开始探索自动搜索算法和网络设计如何协同工作以利用互补方法来改善整体技术水平。通过此过程,我们创建了两个要发...
2020-02-10 00:36:58
2270
原创 (四)ShuffleNet_v2----2018ECCV论文解读
ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture DesignShuffleNet V2:高效CNN架构设计实用指南Abstract当前,神经网络体系结构设计主要由计算复杂度的间接度量即FLOP指导。但是,直接量度,例如速度,还取决于其他因素,例如存储器访问成本和平台特性。因此,这项工作建议评估目标平台上的...
2020-02-09 22:23:49
981
原创 (三)MobileNet_v2----2018CVPR论文解读
MobileNetV2: Inverted Residuals and Linear BottlenecksMobileNetV2:残差和线性瓶颈Abstract在本文中,我们描述了一种新的移动体系结构MobileNetV2,该体系结构可提高移动模型在多个任务和基准以及跨不同模型大小的范围内的最新性能。我们还描述了在称为SSDLite的新颖框架中将这些移动模型应用于对象检测的有效方法。此外,...
2020-02-09 12:15:15
1844
原创 (二)ShuffleNet_v1----2017论文解读
ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile DevicesShuffleNet:一种用于移动设备的极其高效的卷积神经网络Abstract我们介绍了一种名为ShuffleNet的计算效率极高的CNN架构,该架构是专为计算能力非常有限(例如10-150 MFLOP)的移动设备设计的。新架构...
2020-02-08 16:31:21
1449
1
原创 (一)MobileNet_v1----2017论文解读
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision ApplicationsMobileNets:用于移动视觉应用的高效卷积神经网络Abstract我们为移动和嵌入式视觉应用提出了一种称为MobileNets的有效模型。MobileNets基于简化的架构,该架构使用深度可分离卷积来构建轻型深度神经网络。我...
2020-02-07 19:41:04
1396
1
原创 (十三)FSAF----2019CVPR论文解读
Feature Selective Anchor-Free Module for Single-Shot Object Detection用于单发物体检测的功能选择免锚模块图1:在相同的训练和测试规模下,使用强大的ResNeXt-101的基于锚的RetinaNet [22](左)和使用ResNet-50的带有FSAF模块的检测器的定性结果(仅右图)。我们的FSAF模块可通过功能较弱的骨干网...
2020-02-06 14:31:06
2547
1
原创 (十二)GA-RPN----2019CVPR论文解读
Region Proposal by Guided Anchoring指导性锚定的区域提案Abstract区域锚点是现代对象检测技术的基石。最先进的探测器主要依靠密集的锚定方案,在该方案中,使用一组预定义的比例尺和纵横比在空间域上均匀地对锚定进行采样。在本文中,我们将回顾这个基础阶段。我们的研究表明,可以更有效地完成此任务。具体而言,我们提出了一种名为“引导锚定”的替代方案,该方案利用语义特...
2020-02-06 01:03:51
4838
原创 (十一)Cascade R-CNN----2018CVPR论文解读
Cascade R-CNN: Delving into High Quality Object Detection级联R-CNN:致力于高质量目标检测Abstract在对象检测中,需要定义联合正负(IoU)阈值。以低IoU阈值训练的物体检测器,例如0.5,通常会产生噪声检测。但是,**随着IoU阈值的增加,检测性能趋于下降。**造成此问题的主要原因有两个:**1)在训练期间因正样本呈指数消失...
2020-02-04 23:13:03
1352
原创 (十)RefineDet----2018CVPR论文解读
Single-Shot Refinement Neural Network for Object Detection用于目标检测的单发细化神经网络Abstract对于物体检测,两阶段方法(例如,更快的R-CNN)已经实现了最高的准确度,而一阶段方法(例如,SSD)具有高效率的优点。为了继承两者的优点同时克服它们的缺点,在本文中,我们提出了一种新颖的基于单发的检测器,称为RefineDet,该...
2020-02-03 22:53:11
1369
原创 (九)YOLOv3----2018CVPR论文解读
YOLOv3: An Incremental ImprovementYOLOv3:增量改进Abstract我们向YOLO提供一些更新! 我们做了一些小的设计更改以使其更好。 我们还培训了这个相当庞大的新网络。 比上次要大一点,但更准确。 不过速度还是很快的,请放心。 YOLOv3在320×320的条件下以28.2 mAP的速度运行22 ms,与SSD一样精确,但速度快了三倍。 当我们查看旧的...
2020-02-02 23:39:34
3753
1
原创 (八)Mask Rcnn----2017ICCV论文解读
Mask R-CNNAbstract我们为对象实例分割提供了一个概念上简单,灵活且通用的框架。我们的方法有效地检测图像中的对象,同时为每个实例生成高质量的分割蒙版。**该方法称为“Mask R-CNN”,它通过与现有的用于边界框识别的分支并行添加一个用于预测对象遮罩的分支,从而扩展了Faster R-CNN。**掩码R-CNN易于训练,并且以5 fps的速度运行时,对Faster R-CNN的...
2020-01-31 17:17:36
1293
原创 (七)FPN----2017CVPR论文解读
Feature Pyramid Networks for Object Detection用于目标检测的特征金字塔网络Abstract特征金字塔是识别系统中用于检测不同比例物体的基本组件。但是最近的深度学习对象检测器避免了金字塔表示,部分原因是它们需要大量计算和内存。在本文中,我们利用深层卷积网络固有的多尺度,金字塔层次结构来构建具有边际额外成本的特征金字塔。**开发了具有横向连接的自上而下...
2020-01-30 00:28:23
3125
原创 (六)YOLOv2----2017CVPR论文解读
YOLO9000:Better, Faster, StrongerYOLO9000:更好,更快,更强大Abstract我们介绍了YOLO9000,这是一种先进的实时对象检测系统,可以检测9000多个对象类别。首先,我们建议对YOLO检测方法进行各种改进,无论是新颖的还是从以前的工作中得出的。改进的模型YOLOv2在标准检测任务(例如P ASCAL VOC和COCO)方面是最新的。使用新颖的,...
2020-01-28 21:21:44
779
原创 (五)SSD----2016ECCV论文解读
SSD: Single Shot MultiBox Detector摘要我们提出了一种使用单个深层神经网络检测图像中对象的方法。我们的方法,名为SSD,将边界框的输出空间离散化为一组默认框,该默认框在每个特征图位置有不同的宽高比和尺寸。在预测期间,网络针对每个默认框中的每个存在对象类别生成分数,并且对框进行调整以更好地匹配对象形状。另外,网络组合来自具有不同分辨率的多个特征图的预测,以适应处理...
2020-01-28 00:04:06
1103
原创 (四)YOLO_v1----2016CVPR论文解读
You Only Look Once:Unified, Real-Time Object Detection您只需查看一次:统一的实时对象检测Abstract我们提出了YOLO,一种新的物体检测方法。对物体检测的先进工作重新利用分类器进行检测。相反,我们将对象检测作为回归问题构建到空间上分离的边界框和相关的类概率。单个神经网络在一次评估中直接从完整图像预测边界框和类概率。由于整个检测流水线是...
2020-01-14 17:34:27
2482
原创 LeetCode刷题(二十二)-----树-------medium部分(Java、C++)
102. 二叉树的层次遍历给定一个二叉树,返回其按层次遍历的节点值。(即逐层地,从左到右访问所有节点)。例如:给定二叉树:[3,9,20,null,null,15,7],返回其层次遍历结果:[[3],[9,20],[15,7]]思路一:如何遍历一棵树有两种通用的遍历树的策略:深度优先搜索(DFS)在这个策略中,我们采用深度作为优先级,以便从根开始一直到达某个确定的叶子...
2020-01-06 20:10:50
264
原创 LeetCode刷题(二十一)-----树-------easy部分(Java、C++)
104. 二叉树的最大深度给定一个二叉树,找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7],返回它的最大深度3。思路一:C++的三种方法实现(有注解)递归、栈循环实现深度优先遍历;用队列循环实现层遍历。借鉴了伊利亚·穆罗梅茨的代码。/** * De...
2020-01-06 19:45:30
292
原创 (三)OHEM----2016CVPR论文解读
它主要是为了挖掘在极度样本不平衡(负远大于正)的情况的困难样本,也就是那些loss大的样本(正)。我现在就是遇到这种情况,背景样本太多,缺陷样本太小,导致即使训练的很好,也会出现漏报现象。所以,我要在线挖掘出那些漏报的样本,让其再训练,这就是OHEM的本质Training Region-based Object Detectors with Online Hard Example Mining...
2020-01-05 12:00:43
860
原创 (二)Faster-RCNN--NIPS2015论文解读
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks更快的R-CNN:利用区域提案网络实现实时目标检测摘要最先进的目标检测网络依赖于区域建议算法来假设对象位置。像SPPnet [1]和Fast R-CNN[2]这样的进展减少了这些检测网络的运行时间,暴露了区域建议计算作为瓶颈。在这项工作中...
2020-01-04 22:39:00
1835
1
原创 (一)Fast R-CNN论文理解---ICCV2015
Abstract本文提出了一种基于快速区域的卷积网络方法(Fast R-CNN)用于目标检测。 快速R-CNN建立在先前的工作基础上,以使用深度卷积网络有效地对对象提议进行分类。与之前的工作相比,Fast R-CNN采用了多项创新来提高训练和测试速度,同时提高了检测精度。 快速R-CNN训练深VGG16网络比R-CNN快9倍,在测试时间快213倍,并在PASCAL VOC 2012上实现更高的m...
2020-01-04 21:35:47
719
原创 LeetCode刷题(二十)-----栈(Java、C++)
155. 最小栈设计一个支持 push,pop,top 操作,并能在常数时间内检索到最小元素的栈。push(x) -- 将元素 x 推入栈中。pop() -- 删除栈顶的元素。top() -- 获取栈顶元素。getMin() -- 检索栈中的最小元素。示例:MinStack minStack = new MinStack();minStack.push(-2);minStack....
2019-12-30 23:18:52
298
原创 LeetCode刷题(十九)-----链表-------medium部分(Java、C++)
138. 复制带随机指针的链表给定一个链表,每个节点包含一个额外增加的随机指针,该指针可以指向链表中的任何节点或空节点。要求返回这个链表的深拷贝。 示例:输入:{“KaTeX parse error: Expected '}', got 'EOF' at end of input: …:"1","next":{"id”:“2”,“next”:null,“random”:{“KaT...
2019-12-30 23:04:57
346
原创 LeetCode刷题(十八)-----链表-------medium部分(Java、C++)
148. 排序链表在O(nlogn)时间复杂度和常数级空间复杂度下,对链表进行排序。示例 1:输入: 4->2->1->3输出: 1->2->3->4示例 2:输入: -1->5->3->4->0输出: -1->0->3->4->5思路一:排序链表-bottom-to-up O(1) 空间由于题...
2019-12-30 22:19:52
272
原创 LeetCode刷题(十七)-----链表-------easy部分(Java、C++)
160. 相交链表编写一个程序,找到两个单链表相交的起始节点。如下面的两个链表:在节点 c1 开始相交。示例 1:输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA = 2, skipB = 3输出:Reference of the node with value = 8输入解释:相交节点...
2019-12-30 22:08:48
434
原创 LeetCode刷题(十六)-----链表-------easy部分(Java、C++)
237. 删除链表中的节点请编写一个函数,使其可以删除某个链表中给定的(非末尾)节点,你将只被给定要求被删除的节点。现有一个链表 -- head = [4,5,1,9],它可以表示为:示例 1:输入: head = [4,5,1,9], node = 5输出: [4,1,9]解释: 给定你链表中值为 5 的第二个节点,那么在调用了你的函数之后,该链表应变为 4 -> 1 -&...
2019-12-30 21:45:03
351
原创 经典分类模型(七):ResNext(2017)
Aggregated Residual Transformations for Deep Neural Networks----2017ResNextAbstract我们提出了一种用于图像分类的简单,高度模块化的网络体系结构。我们的网络是通过重复构建模块来构建的,该模块聚合具有相同拓扑的一组转换。我们的简单设计导致了同类的多分支架构,仅需设置几个超参数。此策略提供了一个新维度,我们将其称为“基...
2019-12-16 20:18:27
1390
原创 经典分类模型(六):DenseNet(2017CVPR)
Densely Connected Convolutional Networks-----DenseNet_2017CVPR密集连接的卷积网络传统上为了加强CNN模型的表达能力有两种可行的办法,一是将CNN层数增加,变得越来越深;二则是将单层CNN的conv filters数目增加,变得越来越宽。但这两种都会导致训练参数的倍增,从而滑向overfitting的深渊。后来Resnet等网络中关...
2019-12-16 20:06:15
1905
原创 经典分类模型(五):Inception_v2_v3(2015)
Rethinking the Inception Architecture for Computer Vision----2015_inception_v2v3Abstract****卷积网络是用于各种任务的大多数最新计算机视觉解决方案的核心。**自2014年以来,非常深的卷积网络开始成为主流,并在各种基准中获得了可观的收益。尽管增加的模型大小和计算成本往往会转化为大多数任务的即时质量提升(只...
2019-12-16 19:54:41
639
GDAL-3.0.0-cp36-cp36m-win_amd64.whl
2019-10-18
numpy-1.16.2-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
opencv_python_headless-4.1.1.26-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
pandas-0.25.1-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
scikit_image-0.16.1-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
scipy-1.3.0-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
scipy-1.3.1-cp36-cp36m-manylinux1_x86_64.whl
2019-10-18
基于BP神经网络的2DPCA人脸识别算法_任楠楠.pdf
2019-10-18
GDAL-2.3.2.tar.gz
2019-10-18
生成模型-生成对抗网络.pdf
2019-07-17
通过全卷积神经网络(FCN)对医学影像进行语义分割——对于大脑病变区域的识别王晟全(1).pptx
2019-07-03
两电平逆变器半周期对称SHEPWM方法.pdf
2019-06-12
交流牵引系统PWM策略切换研究.pdf
2019-06-12
opencv_python-4.1.0.25-cp36-cp36m-manylinux1_x86_64.whl
2019-06-11
《从自然语言处理入门机器学习》精品课提纲(机器学习之家).pdf
2019-06-11
计算机视觉中的注意力机制(Visual Attention).docx
2019-06-11
最大熵模型.pdf
2019-06-11
Kaggle event推荐比赛思路.pdf
2019-06-11
Spark系统概述与编程入门.pps
2019-06-11
深蓝公开课:基于图像的大规模三维重建.pptx
2019-06-10
邱锡鹏《神经网络与深度学习》.pdf
2019-06-10
推荐系统实践.pdf
2019-06-10
计算机视觉应用与实践.pdf
2019-06-10
中文普通话样例下载.rar
2019-06-10
基于深度学习的自然语言处理实践技术应用.pdf
2019-06-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人