- 博客(19)
- 资源 (8)
- 收藏
- 关注
原创 目标检测之Fast R-CNN
Fast R-CNN是对SPPnet的进一步改进,主要贡献有以下三点:1. 使用multi-task loss将目标分类和bounding box regression统一到一个模型中,实现了single-stage的end-to-end训练。2. 不需要存储中间特征,降低了对硬盘空间的需求。3. 在训练时采用层级采样策略,有效利用参数共享,进一步提升训练速度和精度。
2018-06-26 21:02:08
536
原创 目标检测之SPPnet
SPPnet全称为Spatial Pyramid Pooling in Deep Convolutional Networks,从此可以看出,SPPnet的关键是在CNN里设计了一个Spatial Pyramid Pooling结构,设计该结构的出发点是解决CNN的输入需要为固定大小的问题。这样就会导致...
2018-06-11 22:44:08
1220
原创 目标检测之R-CNN
目标检测(object detection)是计算机视觉领域重要研究内容之一,主要解决图像中包含哪些物体及物体在图像中位置的问题,如下图所示(图片来源于Yolo实验输出),物体的位置使用一个矩形框标注。 近几年深度学习方法的成功应用使目标检测的精度不断提高,下图中个人统计了几种主流方法提出的时间、精度(mAP)和速度(FPS),这些数值并非绝对,因为每个方法均有多个模型,以对精度和速度...
2018-05-22 20:20:29
4821
2
原创 支持向量机(SVM)之线性分类
支持向量机(Support Vector Machine, SVM)是曾经打败神经网络的分类方法,从90年代后期开始在很多领域均有举足轻重的应用,近年来,由于深度学习的兴起,SVM的风光开始衰退,但是其仍然不失为一种经典的分类方法。SVM最初由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis于1963年提出,之后经过一系列改进,现今普遍使用的版本由Co...
2018-04-20 22:07:56
14526
原创 概率分布之共轭分布
共轭分布(conjugate distribution)的概率中一共涉及到三个分布:先验、似然和后验,如果由先验分布和似然分布所确定的后验分布与该先验分布属于同一种类型的分布,则该先验分布为似然分布的共轭分布,也称为共轭先验。
2017-03-13 22:15:17
14991
3
原创 概率分布之Beta分布与Dirichlet分布
Beta分布与Dirichlet分布的定义域均为[0,1],在实际使用中,通常将两者作为概率的分布,Beta分布描述的是单变量分布,Dirichlet分布描述的是多变量分布,因此,Beta分布可作为二项分布的先验概率,Dirichlet分布可作为多项分布的先验概率。这两个分布都用到了Gamma函数,所以,首先了解一下Gamma函数。
2017-03-04 21:53:19
22069
原创 概率分布之二项分布与多项分布
1. 伯努利分布(Bernoulli distribution) 伯努利分布又称二点分布或0-1分布,即一次试验只有正例和反例两种可能,以随机变量表示就是X只能取0或1,伯努利试验是只有两种可能结果的单次随机试验
2017-02-10 22:38:02
36899
原创 拒绝采样(reject sampling)原理详解
蒙特·卡罗方法(Monte Carlo method)也称统计模拟方法,通过重复随机采样模拟对象的概率与统计的问题,在物理、化学、经济学和信息技术领域均具有广泛应用。拒绝采样(reject sampling)就是针对复杂问题的一种随机采样方法。
2017-01-13 15:33:31
66300
19
原创 Ubuntu16.04lts使用Anaconda安装tensorflow并配置GPU
在安装tensorflow之前,首先列示一下我的配置:Ubuntu16.04lts系统,Geforce840M显卡,Cuda8.0,Cudnn v5.1,Anaconda python2.7环境。
2016-10-31 14:15:34
15714
原创 深度学习中的Attention模型介绍及其进展
近期对深度学习中的Attention模型进行了深入研究,该模型在图像识别、语音识别和自然语言处理三大深度学习的热门领域均有广泛的使用,是2014和2015年深度学习领域的重要进展。现对其原理、主要应用及研究进展进行详细介绍。1. 基本原理 Attention模型最初应用于图像识别,模仿人看图像时,目光的焦点在不同的物体上移动。当神经网络对图像或语言进行识别时,每次集中于部分特征上...
2016-10-20 15:29:14
29798
5
原创 Ubuntu16.04lts 安装Theano配置GPU
之前经过一番折腾,终于在Win8.1下安装了Theano并配置好GPU,近几天又经历重重磨难,在Unbutn16.04lts下安装了Theano并配置GPU。 首先列示我的电脑使用软硬件配置:Ubuntu16.04lts 64位系统,NVIDIA Geforce 840M,Anaconda,Cuda7.5
2016-07-31 21:14:45
9793
1
原创 朴素贝叶斯与文本分类
朴素贝叶斯法(Naïve Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法,属于统计学分类方法。简单来说,朴素贝叶斯分类器假设在给定样本类别的条件下,样本的每个特征与其他特征均不相关,对于给定的输入,利用贝叶斯定理,求出后验概率最大的输出。朴素贝叶斯法实现简单,学习与预测的效率均较高,在文本分类领域有广泛的应用。
2016-05-25 20:33:53
13115
原创 不是回归的回归——Logistic Regression
关于Logistic Regression很多人都会有疑问:它用于分类问题,却为什么叫回归?Logistic Regression用到了一个常用的非线性函数——sigmoid函数,那它用于线性分类还是非线性分类?
2016-01-01 15:49:28
3865
原创 谱聚类算法详解
谱聚类(Spectral Clustering)算法简单易行,其聚类性能优于传统的K-means算法。谱聚类将数据的划分转化为对图的分割,是一种基于图论的聚类方法,其直观理解为根据图内点的相似度将图分为多个子图,使子图内部的点相似度最高,子图之间点的相似度最低。1. 图论基础1.1 图的表示 记G=(V,E)G = (V, E)表示一个无向加权图,VV表示所有顶点的集合V={v1,...,v
2015-11-02 18:04:42
13936
1
原创 Kmeans聚类及图像分割
Kmeans是最简单的聚类算法之一,应用十分广泛,Kmeans以距离作为相似性的评价指标,其基本思想是按照距离将样本聚成不同的簇,两个点的距离越近,其相似度就越大,以得到紧凑且独立的簇作为聚类目标。本文参考PRML一书,详细讲解Kmeans聚类的原理以及图像分割应用。
2015-09-29 21:37:08
47933
8
原创 PCA原理及人脸识别应用
本文详细介绍PCA原理,主要参考PRML一书。 PCA也叫Karhunen-Loève transform(KL变换),或Hotelling transform(霍特林变换),是一种无监督学习方法,常用于高维数据的降维,通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量。 PCA的原理有两种等价解释:最大方差和最小投影误差,两种解释都通过一组正交投影,将原始数据
2015-07-26 15:29:55
7888
原创 从信息论的角度理解极大似然法
极大似然估计是一种概率论在统计学中的应用,建立在极大似然原理的基础上,极大似然原理的直观解释是:一个随机试验如有若干个可能的结果A、B、C、…,若在一次试验中,结果A出现,则一般认为试验条件对A出现有利,也即A出现的概率很大,那么就取参数估计,使A出现的概率最大。
2014-11-06 20:38:38
2841
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人