
深度学习
文章平均质量分 84
等待破茧
这个作者很懒,什么都没留下…
展开
-
[深度学习][预训练模型]darknet-yolov7预训练模型下载地址
[预训练模型]darknet-yolov7预训练模型下载地址转载 2022-11-17 16:19:09 · 1353 阅读 · 0 评论 -
行人属性识别的一个调研
行人属性识别的一个调研转载 2022-06-30 08:48:21 · 1933 阅读 · 0 评论 -
烟火检测-烟火检测数据集
烟火检测-烟火检测数据集 作者:leilei 注意:yolov4仅支持火灾检测,yolov5s支持烟雾-火灾2类检测! 安装环境 python: 3.6+ ubuntu16.04 or 18.04 darknet (cuda10.0 docker) *** pytorch 1.6+ (cuda10.2 docker)新开源的数据集项目 工作服反光衣-安全帽数据集: 可用于施工区域or危险区域等指定区域检测:reflective-cl.转载 2021-10-11 09:59:09 · 6775 阅读 · 1 评论 -
开源一个安全帽佩戴检测数据集及预训练模型
转载自开源一个安全帽佩戴检测数据集及预训练模型 - supersayajin - 博客园本文开源了一个安全帽佩戴检测数据集及预训练模型,该项目已上传至github,点此链接,感觉有帮助的话请点star 。同时简要介绍下实践上如何完成一个端到端的目标检测任务。可以看下效果图:同时该模型也可以做人头检测,效果如下:一、背景介绍最近几年深度学习的发展让很多计算机视觉任务落地成为可能,这些任务渗透到了各行各业,比如工业安全,包含的任务如安全帽佩戴检测、高空坠物检测、异常事故检测(行人跌倒..转载 2021-10-11 09:53:34 · 3442 阅读 · 0 评论 -
优Tech分享 自然场景下的不规则目标检测
目标检测技术作为计算机视觉的基础任务之一,在过去几十年取得了显著的进步,尤其近几年,随着深度学习的发展,基于深度神经网络的标准正框目标检测方法迅速取代了传统方法,成为智能安防、家居、出行等领域不可或缺的关键技术,比如人脸检测、人体检测、车辆检测、通用物体检测等。然而,还有一些场景的目标普遍带有任意旋转的多角度并且呈现密集排列,普通正框检测的方法无法满足需求,比如遥感目标检测、货架商品检测、自然场景下的文本检测、顶拍鱼眼镜头下的人体或物体检测。本文将这些场景的目标检测统称为不规则目标检测,之后从目标框定义..转载 2021-08-19 10:07:16 · 2545 阅读 · 1 评论 -
行人检测算法
行人检测算法微信公众号:SIGAI其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源导言行人检测是计算机视觉中的经典问题,也是长期以来难以解决的问题。和人脸检测问题相比,由于人体的姿态复杂,变形更大,附着物和遮挡等问题更严重 ,因此准确的检测处于各种场景下的行人具有很大的难度。在本文中,SIGAI将为大家回顾行人检测算法的发展历程。问题描述行人检测(转载 2021-06-24 13:38:07 · 9759 阅读 · 0 评论 -
yolov3识别的类别_车型识别相关技术
dfb62df6577cd335c07747a58b4da763.png在交通安防中,车型识别是一个重要的技术点,车型识别主要包括车辆检测、型号识别、颜色识别,基于视频的车型识别,还包括跟踪算法的设计。我们在19年开源了一套车型识别模型HyperVID:https://github.com/zeusees/HyperVIDgithub.com2020年7月对该模型进行了进一步更新,目前支持大陆超过4000种车型及年款。感兴趣的技术人员可以关注一下。下面我们将其中涉及的技术进行拆解。1.数据转载 2021-06-11 10:42:29 · 1178 阅读 · 0 评论 -
新视角:用图像分类来建模文字识别也可以SOTA
转载自 https://zhuanlan.zhihu.com/p/352348349新视角:用图像分类来建模文字识别也可以SOTA深度学习(Deep Learning)话题下的优秀答主我们最近做了一个文字识别的工作:CSTR: A Classification Perspective on Scene Text Recognition,简单介绍如下。当前文字识别有两种建模视角:seq2seq-based和segmentation-based。seq2seq-based的方法首先将图.转载 2021-04-28 11:25:00 · 420 阅读 · 0 评论 -
CVPR2021 | CVPR2021最全整理,CVPR2021下载链接,CVPR2021全部论文代码
转载自https://blog.youkuaiyun.com/qq_15698613/article/details/112469087持续更新Github:https://github.com/Sophia-11/...CVPR 2021致力于计算机视觉和模式识别包括颜色检测、跟踪、运动、物体识别、音响和目标检测。Image-to-image Translation via Hierarchical Style Disentanglement Xinyang Li,Shengchuan Zha..转载 2021-04-20 14:16:31 · 3011 阅读 · 0 评论 -
MoCoV3:何恺明!解决Transformer自监督训练不稳定问题!
链接:https://www.zhihu.com/question/453203448/answer/1826367462认真的读了一下论文,还是对He表示大大的钦佩,非常细致的工作。首先MoCo v3不应该是这篇论文的重点,这篇论文的重点应该是将目前无监督学习最常用的对比学习应用在ViT上。MoCo v3相比v2去掉了memory queue,转而像SimCLR那样采用large batch来取得稍好一点的结果,从结构上encoder借鉴BYOL那样增加了一个prediction head,..转载 2021-04-15 17:46:37 · 1612 阅读 · 0 评论 -
16个车辆信息检测数据集收集汇总(简介及链接)
16个车辆信息检测数据集收集汇总(简介及链接)转载自:https://blog.youkuaiyun.com/u014546828/article/details/109089621?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_baidulandingword-1&spm=1001.2101.3001.4242目录1. UA-DETRAC2. BDD100K 自动驾驶数据集3. 综合汽车(CompCars)数据集4.转载 2021-03-22 11:37:21 · 24962 阅读 · 0 评论 -
Resnet 介绍
转载自https://www.jianshu.com/p/93990a641066Resnet介绍终于可以说一下Resnet分类网络了,它差不多是当前应用最为广泛的CNN特征提取网络。它的提出始于2015年,作者中间有大名鼎鼎的三位人物He-Kaiming, Ren-Shaoqing, Sun-Jian。绝对是华人学者的骄傲啊。VGG网络试着探寻了一下深度学习网络的深度究竟可以深几许以能持续地提高分类准确率。我们的一般印象当中,深度学习愈是深(复杂,参数多)愈是有着更强的表达能力。凭着这一基转载 2021-03-16 17:44:33 · 1204 阅读 · 0 评论 -
Resnet18详细结构
转载自 https://zhuanlan.zhihu.com/p/163577599Resnet18详细结构1.根据resnet的pytorch源码绘制的resnet18的结构图,2.注意只有layer2,layer3,layer4只在第一个BasicBlock进行downsample下采样,layer1没有下采样。3.每个layer包含2个BasicBlock,1个BasicBlock中有2次卷积。...转载 2021-03-12 16:53:30 · 6115 阅读 · 2 评论 -
大盘点 | 2020年5篇目标检测算法最佳综述
转载自 https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA%3D%3D&chksm=ec1ca170db6b286683ee4897950ee799708be668f1eac63be918ab185a4ae860cc0ee411addf&idx=1&mid=2247535753&scene=21&sn=b4db91cd7395399cf59c45db3968d6d4#wechat_redirect大盘点 | 2020年5转载 2021-03-10 13:35:20 · 1361 阅读 · 0 评论 -
2020年5篇图像分割算法最佳综述
转载自 https://yongqi.blog.youkuaiyun.com/article/details/113287553大盘点 | 2020年5篇图像分割算法最佳综述导读本文为我们对2020年全部计算机视觉综述论文分方向梳理第二篇,图像分割方向。内容包含2014-2020年图像分割算法、实时语义图像分割方法、语义分割中的无监督自适应研究以及语义分割损失函数等综述。引言在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步。去年上半年,极市曾盘点过计算机视觉领域综转载 2021-03-10 10:05:49 · 1643 阅读 · 0 评论 -
100个深度图像分割算法,纽约大学UCLA等最新综述论文
转载自 https://new.qq.com/omn/20200122/20200122A0BEL300.html100个深度图像分割算法,纽约大学UCLA等最新综述论文【新智元导读】来自纽约大学、滑铁卢大学、UCLA等学者深度学习图像分割最新综述论文,对现有的深度学习图像分割研究进行梳理使其系统化,并提出6方面挑战,帮助读者更好地了解当前的研究现状和思路。可作为相关领域从业者的必备参考文献。戳右边链接上新智元小程序了解更多!图像分割(Image Segmentati...转载 2021-03-10 09:53:02 · 2752 阅读 · 0 评论 -
图像分割的 U-Net 系列方法
转载自https://zhuanlan.zhihu.com/p/57530767图像分割的 U-Net 系列方法在图像分割任务特别是医学图像分割中,U-Net[1]无疑是最成功的方法之一,该方法在2015年MICCAI会议上提出,目前已达到四千多次引用。其采用的编码器(下采样)-解码器(上采样)结构和跳跃连接是一种非常经典的设计方法。目前已有许多新的卷积神经网络设计方式,但很多仍延续了U-Net的核心思想,加入了新的模块或者融入其他设计理念。本文对U-Net及其几种改进版做一个介绍。U-N.转载 2021-03-10 09:47:25 · 2913 阅读 · 0 评论 -
深入浅出计算机视觉(一)
转载自:https://mp.weixin.qq.com/s/shVXTUst65Hoe2dj_Jy1-g先上几个计算机视觉应用的案例:6月6日至8日,在第23届圣彼得堡国际经济论坛上,新华社、俄罗斯塔斯社和搜狗公司联合推出了全球首个俄语AI合成主播,未来它将被应用于塔斯社的新闻报道中。塔斯社是俄罗斯的国家通讯社,作为全球五大通讯社之一,对外向115个国家和地区提供新闻信息,在全...原创 2019-11-20 11:32:26 · 809 阅读 · 0 评论 -
CVPR2018-Segmentation相关论文整理
https://blog.youkuaiyun.com/qq_16761599/article/details/80727466转载 2019-01-31 16:29:26 · 259 阅读 · 0 评论 -
深度学习目标检测部署套路
转载:https://www.jianshu.com/p/64481a936007深度学习视觉目标检测整体思路一、先搭建视觉目标检测算法二、根据实际的硬件平台和实现效果来优化算法。深度学习一般将深度学分为五个部分,网络结构、非线性单元、损失函数、求解器、超参数。 网络结构 卷积、池化、全连接 卷积(深度可分离卷积、空洞卷积、反卷积) backbone...转载 2019-06-18 08:26:00 · 2063 阅读 · 0 评论 -
CTPN --Detecting Text in Natural Image with Connectionist Text Proposal Network
作者和相关链接 个人主页:Zhi Tian,黄伟林,Tong He,Pan He,乔宇 作者简单信息: 论文下载:论文传送门 代码下载:代码传送门几个关键的Idea出发点 文本检测和一般目标检测的不同——文本线是一个sequence(字符、字符的一部分、多字符组成的一个sequence),而不是一般目标检测中只有一个独立的目标。这既是优势,也是难点。优势体现在同一文本线上...转载 2018-10-08 13:55:08 · 319 阅读 · 0 评论 -
Deep Learning(深度学习)之(六)【深度神经网络压缩】Deep Compression (ICLR2016 Best Paper)
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman coding这篇论文是Stanford的Song Han的 ICLR2016 的 best paper,Song Han写了一系列网络压缩的论文,这是其中一篇,更多论文笔记也会在后续博客给出。原创 2016-06-20 08:48:22 · 13673 阅读 · 0 评论 -
何恺明 Detectron安装与Mask RCNN介绍 detectron安装+caffe2安装
转载https://blog.youkuaiyun.com/Xiongchao99/article/details/79167353/https://www.cnblogs.com/zealousness/p/8757353.html detectron安装+caffe2安装因为想跑一下facebook最近开源的detectron物体检测平台,所以安装caffe2+detectron...转载 2018-12-14 14:59:48 · 405 阅读 · 0 评论 -
何恺明“终结”ImageNet预训练时代:从0开始训练神经网络,效果比肩COCO冠军
何恺明,RBG,Piotr Dollár。 三位从Mask R-CNN就开始合作的大神搭档,刚刚再次联手,一文“终结”了ImageNet预训练时代。 他们所针对的是当前计算机视觉研究中的一种常规操作:管它什么任务,拿来ImageNet预训练模型,迁移学习一下。 但是,预训练真的是必须的吗? 这篇重新思考ImageNet预训练(Rethinking ImageNet ...转载 2018-12-13 10:48:01 · 621 阅读 · 0 评论 -
NeurIPS 2018 | 基于学习的多任务框架L2MT,为多任务问题选择最优模型
由腾讯AI Lab 和香港科技大学的研究者合作完成的论文,提出一种新型框架 L2MT(learning to multitask),用基于学习的方法为多任务问题选择最优模型,本文为NeurIPS 2018收录文章。 论文链接:https://arxiv.org/abs/1805.07541 多任务学习旨在利用多个任务中包含的有用信息来帮助提高这些任务的泛化性能。最近几十年...转载 2018-12-13 10:28:24 · 439 阅读 · 0 评论 -
深度学习之(十一)Deep learning中的优化方法:随机梯度下降、受限的BFGS、共轭梯度法
Deep learning中的优化方法 三种常见优化算法:SGD(随机梯度下降),LBFGS(受限的BFGS),CG(共轭梯度法)。 1.SGD(随机梯度下降) 随机梯度下降(Stochastic Gradient Descent, SGD)是随机和优化相结合的产物,是一种很神奇的优化方法,属于梯度下降的一种,适用于大规模问题。原创 2016-06-22 17:09:12 · 11134 阅读 · 2 评论 -
Deep Learning(深度学习)之(九)词向量的内部任务评价和外部任务评价方法
关键词:内部任务评价(Intrinsic Evaluation)和 外部任务评价(extrinsic evaluations)。超参数影响下的类比评价任务。人类决策和词向量距离的相关性。结合上下文处理歧义。窗口分类。这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术原创 2016-06-21 10:15:54 · 10018 阅读 · 2 评论 -
Deep Learning(深度学习)之(十)神经网络在机器学习分类任务中的应用
关键词:神经网络,正向计算,反向传播,神经元,最大化间隔损失,梯度检验, 参数的哈维初始化, 学习速率, ADAGRAD(自适应梯度法)这是斯坦福CS224d深度学习与自然语言处理的第3课,这节课先会介绍单层和多层神经网络和它们在机器学习分类任务中的应用, 接着介绍如何利用反向传播算法来训练这些神经网络模型(在这个方法中,我们将利用偏导数的链式法则来层层更新神经元参数)。在给出神经网络以及转载 2016-06-21 10:26:20 · 11333 阅读 · 0 评论 -
Deep Learning(深度学习)之(七)高维数据的机器学习
高维数据的机器学习 Anima Anandkumar 是加州大学埃尔文分校电子工程与计算机科学系的教职人员。她的研究主要集中于『概率隐变量模型』以及『张量算法』的分析和设计,及其在高维数据学习上的应用。核心结论 * 现代的机器学习涵盖了大量的数据以及变量,构成了高维数据问题。 * 张量方法在处理这种高维数据的机器原创 2016-06-20 13:42:05 · 28221 阅读 · 1 评论 -
Deep Learning(深度学习)之(五)神经网络训练中的高效BP(反向传播算法)
人工神经网络的能力大家都是有目共睹的,在机器学习领域可是占据了一定的地位。这点应该毋庸置疑。它可以建模任意复杂的函数。虽然能力大了有时候也不是好事,因为容易过拟合。但能力小了,就没办法建模复杂的函数,也就是给你数据,你也消化不了。关于神经网络的介绍,这里就不说了,发展了那么久,介绍神经网络的书籍或者资料太多了。还记得我们要干嘛吗?我们想要知道训练神经网络的Tricks!众所周知(如果你不知道,就先原创 2016-06-18 09:03:26 · 11785 阅读 · 0 评论 -
Deep Learning深度学习之(五)CNN卷积神经网络
本文的论文来自:Notes on Convolutional Neural Networks, Jake Bouvrie。 这个主要是CNN的推导和实现的一些笔记,再看懂这个笔记之前,最好具有CNN的一些基础。这里也先列出一个资料供参考:[1] Deep Learning(深度学习)学习笔记整理系列之(七)[2] LeNet-5, con转载 2016-06-17 16:04:15 · 4344 阅读 · 0 评论 -
基于稀疏矩阵的k近邻(KNN)实现
一、概述 这里我们先来看看当我们的数据是稀疏时,如何用稀疏矩阵的特性为KNN算法加速。KNN算法在之前的博文中有提到,当时写的测试程序是针对稠密矩阵数据的。但实际上我们也会遇到不少的稀疏数据,而且有很多是有意而为之的,因为稀疏数据具有稠密数据无法媲美的存储和计算特性,这对工程应用中的内存需求和实时需求是很重要的。所以这里我们也来关注下稀疏矩阵的存储和其在knn算法中的应用举例。原创 2016-06-17 15:58:52 · 2470 阅读 · 0 评论 -
Deep Learning(深度学习)之(二)Deep Learning的基本思想
五、Deep Learning的基本思想 假设我们有一个系统S,它有n层(S1,…Sn),它的输入是I,输出是O,形象地表示为: I =>S1=>S2=>…..=>Sn => O,如果输出O等于输入I,即输入I经过这个系统变化之后没有任何的信息损失(呵呵,大牛说,这是不可能的。信息论中有个“信息逐层丢失”的说法(信息处理不等式),设处理a信息得到b,再对b处理得到c,那么可以证原创 2016-06-17 15:45:35 · 8205 阅读 · 0 评论 -
深度学习之(八)决策树与迭代决策树(GBDT)
决 决策树与迭代决策树(GBDT)5阅读目录1. 决策树的模型2. 决策树的基本知识3. ID3、C4.5&CART4. Random Forest5. GBDT6. 参考内容 今天我们来谈一谈机器学习算法中的各种树形算法,包括ID3、C4.5、CART原创 2016-06-22 16:43:55 · 9298 阅读 · 1 评论 -
GAN的模型和理论发展
在过去一两年中,生成式模型 Generative Adversarial Networks(GAN)的新兴为生成式任务带来了不小的进展。尽管 GAN 在被提出时存在训练不稳定等诸多问题,但后来的研究者们分别从模型、训练技巧和理论等方面对它做了改进。本文旨在梳理这些相关工作。尽管大部分时候,有监督学习比无监督的能获得更好的训练效果。但真实世界中,有监督学习需要的数据标注(label)原创 2016-09-01 15:32:20 · 6554 阅读 · 0 评论 -
深度学习之(八)Twitter情感分析
链接:https://github.com/ayushoriginal/Sentiment-Analysis-Twitter原文链接:http://weibo.com/5581058391/Ee7dUxZBv?from=page_1005055581058391_profile&wvr=6&mod=weibotime&type=commentSentimen转载 2016-10-28 17:47:09 · 14282 阅读 · 0 评论 -
hjimce算法类博文目录--深度学习
转载 https://blog.youkuaiyun.com/hjimce/article/details/50573444转载 2018-12-03 16:31:16 · 226 阅读 · 0 评论 -
深度学习中的图像处理
https://zhuanlan.zhihu.com/p/28601032?utm_source=wechat_session&utm_medium=social 大家整理的代码资源库,收集了大量深度学习项目图像处理领域的代码链接。包括图像识别,图像生成,看图说话等等方向的代码,所有代码均按照所属技术领域建立索引,以便大家查阅使用。2.1 图像生成 2.1.1 绘画风格到图片...转载 2018-12-03 11:13:27 · 5443 阅读 · 0 评论 -
VGG、ResNet、GoogleLeNet、AlexNet等常用网络代码及预训练模型
常用数据集:ImageNet http://www.image-net.org/Microsoft的COCO http://mscoco.org/CIFAR-10和CIFAR-100 https://www.cs.toronto.edu/~kriz/cifar.htmlPASCAL VOC http://host.robots.ox.ac.uk/pascal/VOC/ ...转载 2018-11-23 17:20:24 · 1814 阅读 · 0 评论 -
FaceNet pre-trained模型以及FaceNet源码使用方法和讲解
Pre-trained modelsModel name LFW accuracy Training dataset Architecture20180408-102900 0.9905 CASIA-WebFace Inception ResNet v120180402-114759 0.9965 VGGFace2 In...转载 2018-11-23 17:10:21 · 1295 阅读 · 0 评论