
【深度学习 及 论文笔记】
haoji007
机器学习爱好者
展开
-
YOLOv5在建筑工地中安全帽佩戴检测的应用(已开源+数据集)
前言Amusi 发现一个很棒的开源项目,利用YOLOv5进行目标检测的"落地化"应用:安全帽佩戴检测。该项目使用了YOLOv5s、YOLOv5m、YOLOv5l来训练安全帽佩戴检测数据集,代码和权重均已开源!安全帽佩戴检测数据集也是开源的(共含7581 张图像)!项目教程也相当详细,推荐入门练手学习!而且有意思的是,该项目和数据集的两位作者均是中国人,点赞!项目链接(文末附下载):https://github.com/PeterH0323/Smart_Construction数据集链接转载 2021-01-12 00:45:13 · 4928 阅读 · 3 评论 -
Python破解验证码,只要15分钟就够了!
让我们一起攻破世界上最流行的WordPress的验证码插件每个人都讨厌验证码——在你被允许访问一个网站之前,你总被要求输入那些烦人的图像中所包含的文本。验证码被设计成,以验证你是一个真正的人的方式,来防止电脑自动填写表单。但是随着深度学习和计算机视觉的兴起,它们现在往往很容易被攻破。我在读Adrian Rosebrock的优秀的著作《Python计算机视觉深度学习》。在书中,Adrian简单地描述了他如何用机器学习绕过E-ZPass New York网站的验证码:Adrian没有访...转载 2020-05-27 01:10:39 · 2372 阅读 · 0 评论 -
三种激活函数以及它们的优缺点
三种激活函数以及它们的优缺点sigmoidsigmoidsigmoid导数:g′(z)=a(1−a)g^{'}(z)=a(1-a)g′(z)=a(1−a)最基本的激活函数,logistics regression以及讲解深度神经网络的时候作为简单例子,但实际上很少使用。原因如下:当z非常大或者非常小的时候,a的斜率变得越来越接近0,这会使得梯度下降算法变得极为缓...转载 2019-11-27 18:41:28 · 1518 阅读 · 1 评论 -
全球知名的人工智能研究院(实验室)
文章目录全球知名AI研究院(实验室) 国外 谷歌 Facebook 微软 麻省理工 斯坦福 卡内基梅隆 国内 阿里巴巴 腾讯 百度 旷视 南京大学 清华大学 北京大学 全球知名AI研究院(实验室)国外谷歌DeepMind,是一家英国的人工智能公司,由人工智...转载 2019-11-24 17:47:15 · 1613 阅读 · 0 评论 -
LeCun、Bengio和Hinton综述论文《deep learning》
本文链接:https://blog.youkuaiyun.com/youyuyixiu/article/details/537630892015年,深度学习三大神(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),为了纪念人工智能60周年,合作在Nature上发表深度学习的综述性文章,介绍了深度学习的基本原理和核心优势,详细介绍了CNN、分布式特征表示、RNN...转载 2019-11-01 09:47:36 · 1091 阅读 · 0 评论 -
深度学习----现今主流GAN原理总结及对比
本文链接:https://blog.youkuaiyun.com/Sakura55/article/details/81514828 1.GAN 2.CGAN 3.DCGAN 4.WGAN 5.WGAN-GP 6.LSGAN 7.BEGAN 8.GAN的基本代码 1.GAN先来看看公式:GAN网络主要...转载 2019-10-28 01:13:27 · 1593 阅读 · 0 评论 -
史上最全的人工智能知识图谱
史上最全的人工智能知识图谱转载于公众号: 数邦客人工智能知识图谱1 知识图谱知识图谱(Knowledge Graph)又称为科学知识图谱,由Google与2012年5月提出,目的是提高搜索引擎的能力,改善用户的搜索质量及搜索体验。随着人工智能技术的发展和应用,知识图谱逐渐成为关键技术之一,现已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。维基百科...转载 2019-10-18 09:38:37 · 7641 阅读 · 0 评论 -
RBM(受限玻尔兹曼机)
RBM(受限玻尔兹曼机)http://www.cnblogs.com/xiaokangzi/p/4492466.html基于能量模型 (EBM)基于能量模型将关联到感兴趣的变量每个配置的标量能量。学习修改的能量函数使他它的形状具有最好的性能。例如,我们想的得到最好的参量拥有较低的能量。EBM的概率模型定义通过能量函数的概率分布,如下所示:转载 2016-07-29 15:22:56 · 524 阅读 · 0 评论 -
自编码器及相关变种算法简介
本文对自编码器(Auto-Encoder)算法及其相关变种算法进行简要介绍,其中包括 Regularized Auto-Encoder、Sparse Auto-Encoder、Denoising Auto-Encoder 和 Contractive Auto-Encoder,重点讨论各算法的基本思想及优化时所需目标函数的构造。转载 2016-07-29 15:23:58 · 444 阅读 · 0 评论 -
受限玻尔兹曼机(RBM)学习笔记
去年 6 月份写的博文《Yusuke Sugomori 的 C 语言 Deep Learning 程序解读》是囫囵吞枣地读完一个关于 DBN 算法的开源代码后的笔记,当时对其中涉及的算法原理基本不懂。近日再次学习 RBM,觉得有必要将其整理成笔记,算是对那个代码的一个补充。 目录链接(一)预备知识(二)网络结构(三)能量函数和概率分布转载 2016-07-29 15:27:06 · 528 阅读 · 0 评论 -
【论文笔记】基于2-channel network的图片相似度判别-CVPR 2015
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/50098483作者:hjimce一、相关理论 本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章:《Learning to Compare Image Patches via Convolutional Neural Networks》,本篇文章对经典的算法Siam转载 2016-07-31 22:34:02 · 1347 阅读 · 0 评论 -
各种编程语言的深度学习库整理
原文 http://www.youkuaiyun.com/article/2015-09-15/2825714 Python 1. Theano 是一个python类库,用数组向量来定义和计算数学表达式。它使得在Python环境下编写深度学习算法变得简单。在它基础之上还搭建了许多类库。1. Keras 是一个简洁、高度模块化的神经网络库,它的设计参考了Torch,用Pyt转载 2016-08-02 11:24:17 · 399 阅读 · 0 评论 -
在ubuntu 15.10 上配置vim ,用来进行python 开发
来自: http://www.cnblogs.com/py-tiger/p/vim_python.html1,安装vim,你可以使用ubuntu 自带的apt-get 工具安装。apt-get install vim-gnome2,安装成功后,进行配置1>首先进行自动提示补全的配置( pydiction ) 从官方上下载 http://www.vim.org/scr转载 2016-08-02 12:55:53 · 385 阅读 · 0 评论 -
两个命令把 Vim 打造成 Python IDE
运行下面两个命令,即可把 Vim(含插件)配置成 Python IDE。目前支持 MAC 和 Ubuntu。Shell curl -O https://raw.githubusercontent.com/vince67/v7_config/master/vim.shsudo bash vim.shcurl -O https://raw.githubusercontent.转载 2016-08-02 13:04:05 · 1740 阅读 · 1 评论 -
【深度学习笔记】个人阅读的Deep Learning方向的paper整理
写在前面:最近看文章毫无头绪,文章一把抓乱看,看到下面这个博客来忍不住转载过来,以便自己不用到处找论文。以下是转载部分================================================================================转载来源:http://hi.baidu.com/chb_seaok/item/6307c转载 2016-10-10 09:47:42 · 1260 阅读 · 0 评论 -
【深度学习笔记】多层感知机,非权值共享型卷积神经网络,权值共享型卷积神经网络之间的关系
前言:最近学习深度学习,有感写一点总结。我们常常所说的神经网络,一般是指原始的多层感知机,简称MLP,它是在原始感知机堆叠多层而成的,MLP完全由全连接层组成(当然也有激活函数),即Caffe里的IP层。MLP的最大的缺点在于参数众多,比如说我们的网络层为1000--1000--500--20,那么它的总的参数为:1000*1000+1000*500+500*20. 参数过多不好训练,转载 2016-10-10 09:48:24 · 1372 阅读 · 0 评论 -
【深度学习笔记】深度学习用于图片的分类和检测总结
前言: 主要总结一下自己最近看文章和代码的心得。1. CNN用于分类:具体的过程大家都知道,无非是卷积,下采样,激活函数,全连接等。CNN用于分类要求它的输入图片的大小是固定的(其实不单单是CNN,很多其它的方法也是这样的),这是它的一个不足之处之一。目前的大部分CNN都是用来做分类比较多。2. CNN用于检测:主要的方法有两种,细分一下有三种,第一种最为简单和暴力的,转载 2016-10-10 09:49:12 · 1088 阅读 · 0 评论 -
【论文笔记】Deep Learning Face Representation from Predicting 10,000 Classes
来自:CVPR 2014 作者:Yi Sun ,Xiaogang Wang,Xiaoao Tang题目:Deep Learning Face Representation from Predicting 10,000 Classes主要内容:通过深度学习来进行图像高级特征表示(DeepID),进而进行人脸的分类。优点:在人脸验证上面做,可以很好的扩展到其他的转载 2016-10-10 10:03:39 · 513 阅读 · 0 评论 -
【论文笔记】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
文章:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition来源:Technicalreport大意:通过图像金字塔来实现识别中的尺度无关性;作者:KaimingHe,Xiangyu Zhang, Shaoqing Ren, Jian Sun ,来自微软主要内容:转载 2016-10-10 10:05:19 · 365 阅读 · 0 评论 -
【论文笔记】Rich feature hierarchies for accurate object detection and semantic segmentation
文章:《Rich feature hierarchies for accurate object detection and semantic segmentation》 作者:Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik 单位:UC Berkeley,CVPR2014? 是否开放代码:是,地址转载 2016-10-10 10:06:10 · 349 阅读 · 0 评论 -
【论文笔记】Deep Neural Networks for Object Detection
论文:Deep Neural Networks for Object Detection>> 作者:Christian Szegedy Alexander Toshev Dumitru Erhan来源: Google是否开放代码: 否主要思想:利用DNN来做目标检测,因为现在的CNN等深度学习在识别上面做的还挺好,但是在目标检测上面,好像没有特别突出的结果。目标检转载 2016-10-10 10:07:09 · 596 阅读 · 0 评论 -
【论文笔记】DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition
时间:2014/7/29 10:00 论文题目:DeCAF: A Deep Convolutional Activation Featurefor Generic Visual Recognition作者:JeffDonahue, Yangqing Jia,Oriol Vinyals来源:这个就是大名鼎鼎的Caffe的前身Decaf,目前Decaf已经不再维护,转转载 2016-10-10 10:07:54 · 805 阅读 · 1 评论 -
【论文笔记】Learning Deep Face Representation
时间:2014/9/25 17:00 文章:《 LearningDeep Face Representation》还没发表~人脸的表示,易于实施,叫做Pyramid CNN,采用了greedy-filter-and-down-sample的操作,使得训练非常快,而且高效,并且PyramidCNN可以和多尺度人脸特征结合。97.3%的LFW。传统的人脸表转载 2016-10-10 10:08:41 · 528 阅读 · 0 评论 -
【论文笔记】Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
阅读时间:2015.04.26 论文源:NIPS2014 作者及单位: David Eigen deigen@cs.nyu.edu Christian Puhrsch cpuhrsch@nyu.edu Rob Fergus fergus@cs.nyu.edu 纽约大学主要内容:通过CNN来进行对单张图片进行深度估计,单张图片进行深度信息估计做的人比较少,一般是用双目摄像转载 2016-10-10 10:10:19 · 982 阅读 · 0 评论 -
【论文笔记】FaceNet: A Unified Embedding for Face Recognition and Clustering
论文:FaceNet: A Unified Embedding for Face Recognition and Clustering时间:2015.04.13来源:CVPR 2015来自谷歌的一篇文章,这篇文章主要讲述的是一个利用深度学习来进行人脸验证的方法,目前在LFW上面取得了最好的成绩,识别率为99.63%(LFW最近数据刷的好猛)。传统的基于CNN的人脸识别方法为转载 2016-10-10 10:09:39 · 887 阅读 · 0 评论 -
【论文笔记】Recover Canonical-View Faces in the Wild with Deep Neural Network
文章来源:CVPR2014作者:Zhenyao Zhu,Ping Luo,Xiaogang Wang,Xiaoou Tang(香港中文大学果然牛)主要内容:提出了利用深度学习(还是CNN)来进行人脸图像重构正面人脸,然后利用重构的正面人脸图像来进行人脸的verification,当然能够取得更高的准确率(比没有用正脸去verification),文章提出利用DL来学习从任意转载 2016-10-10 10:04:31 · 747 阅读 · 0 评论 -
【Caffe代码解析】Layer网络层
Layer 功能:是所有的网络层的基类,其中,定义了一些通用的接口,比如前馈,反馈,reshape,setup等。#ifndef CAFFE_LAYER_H_#define CAFFE_LAYER_H_#include #include #include #include "caffe/blob.hpp"#include "caffe/common.hpp"#includ转载 2016-10-10 10:21:00 · 605 阅读 · 0 评论 -
【机器学习实践】Kaggle 之 Face Verification Challenge练手
导言这个一个Inclass 的比赛,主要任务就是给定1000多张图片所组成的901153对所有的组合图像,要求进行判断是否是同一个人。作为第一次做Kaggle的比赛,来练练手还是不错的。由于在这所有的二元组中,数据是极其步平衡的,所以会导致即使我们把这些所有的组合都判断为1(不同的人),它的精度也会达到99%以上,所以在这里单单评测识别率是没有意义的。官方这边给出的评价方法是AUC转载 2016-10-11 16:07:01 · 829 阅读 · 0 评论 -
【机器学习】Tensorflow基本使用
TensorflowTensorFlow 是谷歌开源的机器学习框架,相对于其它现有框架来说,其具有比较好的扩展性,但是也牺牲了它的速度。下面介绍Tensorflow 的基本使用:1, tensorflow 基本操作:import tensorflow as tfimport numpy as np12乘法:a = tf.placeholder("float") # 创建符转载 2016-10-11 16:08:19 · 1609 阅读 · 1 评论 -
人脸预处理工具FaceTools
前言:在做人脸分析的时候,常常要求人脸数据已经经过检测、归一化、对齐等操作,然而我们网上下载的数据库,大部分是没有经过这一些处理的,所以也经常需要我们自己写程序来完成这些数据预处理。虽然网上都有现成的一些人脸检测和关键点检测的可执行文件提供,但是,使用起来都不大方便。在这里我提供了一个简单的工具:用于处理简单的人脸检测、关键点检测、基于关键点检测的人脸对齐这三个功能。最大的优点就是你只转载 2016-10-11 16:09:37 · 1448 阅读 · 1 评论 -
MatConvNet学习笔记
基础概述MatConvNet是VLFeat的一部分,是卷积神经网络(CNN)的一个实现。既可以使用matlab编程,又能使用GPU加速,是一个不错的CNN库。 MatConvNet 主页安装下载MatConvNet工具箱点此下载工具箱我下载的版本是 matconvnet-1.0-beta13.tar解压文件将压缩文件解压到 matconvnet-1.0-be转载 2016-10-12 20:39:35 · 663 阅读 · 0 评论 -
【论文笔记】One Millisecond Face Alignment with an Ensemble of Regression Trees
参考文献:Kazemi V, Sullivan J. One millisecond face alignment with an ensemble of regression trees[C]//Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on. IEEE, 2014: 1867-1874转载 2016-10-12 20:41:11 · 825 阅读 · 0 评论 -
【论文笔记】Joint Cascade Face Detection and Alignment
论文:Joint Cascade Face Detection and Alignment.pdf实现:https://github.com/FaceDetect/jointCascade_py部分内容引用自:http://www.cnblogs.com/sciencefans/p/4394861.html#!comments首先是简介:论文首先介绍了一些当今人转载 2016-10-12 20:41:26 · 734 阅读 · 0 评论 -
【论文笔记】A Convolutional Neural Network Cascade for Face Detection
论文:A Convolutional Neural Network Cascade for Face Detection.pdf实现:https://github.com/anson0910/CNN_face_detection该论文发表于2015年CVPR上,作者提出了一种级连的CNN网络结构用于人脸识别,论文的主要贡献有以下四点:提出了一种级连的CNN网络结构用于高转载 2016-10-16 08:32:37 · 964 阅读 · 1 评论 -
【论文笔记】Face Alignment at 3000 FPS via Regressing Local Binary Features
论文:Face Alignment at 3000 FPS via Regressing Local Binary Features.pdf实现:https://github.com/luoyetx/face-alignment-at-3000fps摘要&介绍:论文有两个新颖的点,一是采用局部二值特征,二是用局部性规则指导学习这些特征,最终的识别效果和实现速度俱佳。转载 2016-10-16 08:32:55 · 776 阅读 · 0 评论 -
【论文笔记】From Facial Parts Responses to Face Detection: A Deep Learning Approach
论文:From Facial Parts Responses to Face Detection A Deep Learning Approach.pdf实现:暂无这篇论文发表于ICCV2015,很有借鉴意义,论文提出了一个新的概念deep convolutional network (DCN) ,在FDDB数据集上达到了目前世界领先水准,这篇论文可以与之前《Joint Cas转载 2016-10-16 08:33:13 · 821 阅读 · 0 评论 -
人脸识别论文梳理
梳理:A Convolutional Neural Network Cascade for Face Detection是CNN与级联思想在检测的应用From Facial Parts Responses to Face Detection A Deep Learning Approach是关键点检测与CNN结合的思想Object Detection with Pixel转载 2016-10-16 08:33:45 · 2813 阅读 · 1 评论 -
人脸关键点标识参考
85点 (AFLW)68点 (Dlib)27点21点 (aflw)5点转载 2016-10-16 08:33:54 · 4076 阅读 · 0 评论 -
深度学习(一)深度学习学习资料
持续更新原文地址:http://blog.youkuaiyun.com/hjimce/article/details/45421595作者:hjimce一、学习清单1、综合类(1)收集了各种最新最经典的文献,神经网络的资源列表:https://github.com/robertsdionne/neural-network-papers 里面包含了深度学习领域经典、转载 2016-10-16 08:36:46 · 490 阅读 · 0 评论 -
深度学习(二)theano环境搭建
theano环境搭建原文地址:http://blog.youkuaiyun.com/hjimce/article/details/46654229作者:hjimce搭建theano实属不易,因为每个人的电脑不一样,所以安装过程会有所区别,特别是安装cuda的时候,很容易驱动冲突。网上教程一大堆,但是我都没搭建成功,最后根据官网的教程,一步一步的琢磨,总算功夫不负有心人。因此写一下艰转载 2016-10-16 08:50:58 · 579 阅读 · 0 评论