- 博客(44)
- 资源 (8)
- 收藏
- 关注
原创 深度网络特定层数据抽取实验
徐海蛟教学VGG-16 是牛津大学视觉几何组(Visual Geometry Group)开发的卷积神经网络结构,该深度学习神经网络赢得了 ILSVR 竞赛(ImageNet)2014的冠军,时至今日,VGG 仍然被认为是一个杰出的视觉模型。今天,我们来做基于 VGG16 深度学习预训练权重的特定层 "block4_pool" 特征数据抽取实验,以便后续进一步处理。
2017-02-23 22:09:02
1349
原创 基于 VGG16 深度学习预训练权重的图像分类预测实验
徐海蛟教学一直以来,计算科学家在为建立世界上最精确的计算机视觉系统孜孜不倦地努力着,但取得进展的过程却一直如马拉松竞赛般漫长而艰辛。斯坦福大学每年都会举行一个比赛 ILSVR ,邀请谷歌、微软、百度等IT企业使用ImageNet —— 全球最大的图像识别数据库,测试他们的系统运行情况。每年一度的比赛也牵动着各大巨头公司的心弦,过去几年中,系统的图像识别功能大大提高,ImageNet 2
2017-02-19 12:25:24
16951
4
转载 基于Keras深度学习框架的Cifar-10练习
徐海蛟教学CIFAR-10数据集是由 Hinton 大牛人的两个大弟子 Alex Krizhevsky、Ilya Sutskever 收集的一个用于普适物体识别的数据集,它包含 60000 个32×32的彩色png图像,共有10类:airplane, automobile, bird, cat, deer, dog, frog, horse, ship, truck。前面5万幅png图
2017-02-18 21:07:48
8200
1
转载 Ubuntu14.04上轻松安装与优化轻量级深度学习框架Theano[转]
徐海蛟教学一,安装轻量级深度学习框架TheanoWarningIf you want to install the bleeding-edge or development version of Theano from GitHub, please make sure you are reading the latest version of this pa
2017-02-04 11:56:14
747
转载 画出卷积神经网络结构图[转载]
徐海蛟教学使用Keras框架(后端可选tensorflow或者theano),可以画出卷积神经网络的结构图帮助我们理解或确认自己创立的模型。问题的关键在于使用from keras.utils.visualize_util import plot中的plot函数。但是直接使用会提示缺少pydot。首先安装sudo pip3 install pydot以及sudo
2017-02-02 14:10:08
37797
2
转载 卷积神经网络CNN基本概念笔记[转载]
徐海蛟教学UNDERSTANDING CONVOLUTIONAL NEURAL NETWORKS FOR NLP卷积卷积就是对矩阵(图像)应用的滑动窗口函数。图中绿色为一个二值图像,每个值代表一个像素(0是黑,1是白)。(更典型的是像素值为0-255的灰阶图像)图中黄色的滑动窗口叫卷积核、过滤器或者特征检测器,也是一个矩阵。我们将这个
2017-02-02 14:05:51
675
转载 如何加速一个网站——web性能三方面[转载]
徐海蛟教学Building a Shop with Sub-Second Page Loads: Lessons Learned利用web缓存和NoSQL系统建立一个应对高访问量的快速网上商店。用户满意度和转化率强相关(hard-wired),并直接影响利润。如何加速一个网站有三大驱动力影响网页应用的页面加载时间:
2017-02-02 13:56:31
1157
转载 面向小数据集构建图像分类模型
本文地址:http://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html本文作者:Francois Chollet概述在本文中,我们将提供一些面向小数据集(几百张到几千张图片)构造高效、实用的图像分类器的方法。本文将探讨如下几种方法:
2017-02-02 13:20:54
12159
转载 轻量级深度学习框架 Keras简介
徐海蛟教学Keras是基于Theano的一个深度学习框架,它的设计参考了Torch,用Python语言编写,是一个高度模块化的神经网络库,支持GPU和CPU。使用文档在这:http://keras.io/,中文文档在这:http://keras-cn.readthedocs.io/en/latest/ ,这个框架是2015年流行起来的,使用中遇到的困惑或者问题可以提交到github:h
2016-11-09 19:07:35
5387
转载 Keras: 基于Theano和TensorFlow的快速深度学习库
徐海蛟教学Keras是一个极简和高度模块化的神经网络库,Keras由纯Python编写而成并基Tensorflow或Theano。Keras 为支持快速实验而生,能够把你的idea迅速转换为结果,学习门槛较低。Windows的版本选择,可采用Windows 7 / 10作为基础环境。python环境建设推荐使用科学计算集成python发行版Anaconda,An
2016-11-02 23:47:29
3195
转载 徐海蛟:深度学习与计算机视觉理论与实验4
AlphaGo的胜利,无人驾驶的成功,模式识别的突破性进展,人工智能的的飞速发展一次又一次地挑动着我们的神经。作为人工智能的核心,机器学习也在人工智能的大步发展中备受瞩目,光辉无限。 如今,机器学习的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。 但也许我们不曾想到的事机器学习乃至人工智能的起源,是对人本身的意识、自我
2016-09-20 17:35:03
1999
翻译 徐海蛟:机器学习理论与实验3 - A
徐海蛟 Teaching.我们现在开始讨论有监督学习,首先讨论的是回归问题。回归问题的目标是在给定D维输入变量x的情况下,预测一个或者多个连续目标变量t的值。在机器学习理论与实验1中,我们已经遇到了回归问题的一个例子:多项式曲线拟合问题。多项式是被称为线性回归模型的一大类函数的一个具体的例子。线性回归模型有着可调节的参数,具有线性函数的性质,将会成为本节的关注点。线性回归模型的最简单的
2016-09-14 22:35:13
521
翻译 徐海蛟:机器学习理论与实验2
徐海蛟 Teaching.考虑一个随机变量X,如果给出X的一系列独立同分布的观察值,那么如何由这些观察值来估计出X的密度函数P(X)?这就是密度估计问题。概率分布可分为参数分布和非参数分布。参数分布函数是由一些参数控制的,比如高斯分布中平均值和方差,用参数分布的方法去估计密度时,必须确定合适的参数。从频率论来看,可用极大似然函数来确定参数;而从贝叶斯论来看,需要引入共轭先
2016-09-14 14:12:06
978
转载 徐海蛟:深度学习与计算机视觉理论与实验2
徐海蛟教学MatConvNet(CNNs for MATLAB)工具箱是大名鼎鼎的卷积神经网络(CNN)的一种MatLab实现版本,常用于执行计算机视觉任务,其简单高效,容易上手,并且有不少可用于图像分类、图像分割、人脸识别和文本检测等用途的预训练CNN。安装 MatConvNet1. 在VLFeat官网下载 MatConvNet 工具箱,文件格式是 matco
2016-08-31 04:31:51
640
转载 徐海蛟:MatLab一维数组求解局部极值
MatLab 函数 fingpeaks 对一维数组求解局部极大和极小值徐海蛟老师课堂教学举例说明。clc; clear;% 清屏清空变量figure('Color', 'w');% 背景:白色Data = [1 -2 3 -4 5 -6 7 8 5 4 1 2 -3 -1 -5 9 7 -6 5];plot(Data, '-s', 'LineWidth',2);%
2016-08-04 11:56:47
6420
转载 徐海蛟:Java null和数据库NULL的认识
Java null和数据库NULL的认识徐海蛟老师课堂教学.Java是面向对象的高级语言。Java中,null表示类或对象的变量是空,不代表任何对象或实例,可以将null赋给引用类型变量,但不可以将null赋给基本类型变量;任何对象在没有进行初始化时,它默认的值都是null。没有实体的对象称为空对象;空对象不能使用,即不能让一个空对象去调用方法产生行为;大名鼎鼎的NullPoint
2016-08-03 15:52:04
775
原创 徐海蛟:Matlab计算大规模图片数据集的L1距离
比较两幅图片之间的距离或者相似性,我们常以Matlab pdist函数或者pdist2函数计算。计算大规模图片数据集的两两图片之间的距离,很自然想到双重for循环完成了。不过,这很慢:function KMatrix = getL1( X, Y ) %L1距离m = size(X,1); n = size(Y,1);KMatrix = zeros(m,n);for i = 1:
2014-01-02 11:59:11
1496
原创 徐海蛟:Win7系统重装,Ubuntu LINUX启动项丢失,如何恢复(终极版)
实验室一台Intel服务器上安装了3个子系统: windows, Ubuntu LINUX 和 Ubuntu Wubi 伪LINUX系统。Linux系统下安装了hadoop集群。这几天实验室服务器重装了Windows 7(Win7),结果LINUX启动菜单项全部丢失。只能进入Win7,无法进入Linux hadoop。由于是两个Ubuntu Linux系统启动菜单项丢失,所以
2013-11-28 11:52:20
1899
原创 RBF高斯径向基核函数-libsvm
XVec表示X向量。||XVec||表示向量长度。r表示两点距离。r^2表示r的平方。k(XVec,YVec) = exp(-1/(2*sigma^2)*(r^2)) = exp(-gamma*r^2) ...... 公式-1这里, gamma=1/(2*sigma^2)是参数, r=||XVec-YVec||实际上,可看作是计算2个点X与Y的相似性。很
2013-11-17 12:52:24
20450
翻译 徐海蛟:MatLab2012b/MatLab2013b分类器大全(svm,knn,随机森林等)
train_data是训练特征数据, train_label是分类标签。Predict_label是预测的标签。MatLab训练数据, 得到语义标签向量 Scores(概率输出)。1.逻辑回归(多项式MultiNomial logistic Regression)Factor = mnrfit(train_data, train_label);Scores = mnrv
2013-11-10 12:04:30
9388
原创 svm 预测标签的概率输出
对于图片或文本,如果童鞋们需要初试分类效果,在MatLab做实验是比较简单的。例如:使用Libsvm库函数svmtrain()训练学习出一个模型Factor, 然后代入Factor,得到预测标签向量Predict_label。但是,这些都是人家的工作,假若我们加入自己的思路呢?例如:对于图片分类实验,预测标签的时候,加入K阶标签共现值呢?你或许不是仅仅得到预测标签Predict_lab
2013-11-08 12:04:52
9676
6
翻译 徐海蛟:matlab 程序在命令行直接运行
在做大数据(Big Data)实验的时候,一个程序跑上很久。有时候需要把程序拆分成几份同时去命令行运行,自己可安心做手头的工作。如何让matlab 程序在命令行直接运行?matlab 文件名以.m为扩展名。只需要使用 -r 选项,比如,运行当前目录下的 test.m :matlab -nojvm -nosplash -r test 或者matlab -nodesktop
2013-11-04 09:52:07
1723
翻译 徐海蛟:向量X的归一化及其Matlab简单示例
徐海蛟博士归一化是要把需要处理的数据经过处理后限制在一定范围内,例如:[-1,1]或[0,1]。归一化是为了后续数据处理的方便,也使得算法程序收敛加快。在Matlab里面,归一化的方法共有3种:(1)mapminmax % 范围映射(2)mapstd % 均值与偏差(3)自定义函数在数据预处理过程中,对数据集按行或者按列(统一记为向量X)进行L1或者L2范数
2013-10-20 15:00:54
5485
转载 svm理论与实验之22: 自定义核函数在Matlab平台上的使用
徐海蛟博士 Teaching.1984年,莫勒尔和班格尔特合作成立了MathWorks公司,正式把MATLAB推向市场。MATLAB(矩阵实验室)是MATrix LABoratory的缩写,是一款由美国The MathWorks公司出品的商业数学软件。MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据
2013-10-17 17:03:49
3674
翻译 svm理论与实验之21: 自定义核函数的使用
徐海蛟博士真实场景下,数据的特征可能比较复杂,系统提供的4种核函数或许达不到最佳效果,那么就需要自定义核函数了。当然,有很多大牛干这个事情,我们可以拿来使用,通过自定义核方式。如何用?这时候不再把训练与测试数据文件作为输入参数了,而是使用核矩阵作为输入参数。Assume there are L training instances x1, ..., xL .
2013-10-16 20:56:04
1859
原创 svm理论与实验之20: libsvm多标签实验与评价指标
徐海蛟博士 Teaching.数据集如下:名称 源类型 类数 训练样本 测试样本 特征数----------------------------------------------------------------scene景色 MB04a 多标签6 1,211 1,196 294yeast酵母 AE02a 多标签14 1,500 917
2013-10-15 17:49:22
2093
原创 svm理论与实验之19: libsvm多类实验
徐海蛟博士 Teaching.我们实验环境:libsvm 3.17, python 2.7.3, gnuplot 4.6。数据集从小到大: dna 生物dna, satimage 卫星图像, letter 字母。数据已经下载到了svm-数据/下。我们看下数据集基本情况:名称 源类型 类数 训练样本 测试样本 特征数--------------------
2013-10-15 10:40:48
1468
转载 svm理论与实验之18: libsvm自动参数选择
徐海蛟博士 Teaching.libsvm可用grid.py(grid的意思是:网格)这个网格搜索python程序帮我们自动完成参数选择。这里,给童鞋们上课说说交叉验证与网格搜索。1. 交叉验证交叉验证是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力,能够避免过拟合问题。交叉验证一般要尽量满足: 1)训练集的比例要足够多,一般大于一半(>50%)
2013-10-14 16:44:02
1851
翻译 svm理论与实验之17: libsvm最简单Java示例(2行)
徐海蛟博士 Teaching.怎么用dos命令行使用svm-scale,svm-train,svm-predict三个程序,我们在前面博文中已经练习过了。这里给出用JAVA调用LibSVM API最简单的示例,用JAVA进行SVM分类只需要2行程序就搞定了。训练集在官网有了,是UCI breast-cancer数据,乳腺癌数据,类数:2,总样本:683,我们把前面644个样
2013-10-14 11:31:54
1785
转载 svm理论与实验之13: libsvm库函数说明
徐海蛟博士 Teaching.徐海蛟老师教学学习的libsvm版本是3.17最新版。1. libSVM的数据格式Label 1:value 2:value … …Label:是类别的标识,比如上节train.model中提到的1 -1,你可以自己随意定,比如-10,0,15。当然,如果是回归,这是目标值,就要实事求是了。Value:就是要训练的
2013-10-12 11:27:57
1210
转载 svm理论与实验之12: Hello World
徐海蛟博士 Teaching.我教学学习的libsvm版本是3.17最新版。应用3.17最新版自带的训练集heart_scale来完成第一个实验,该训练集样本数:270,特征数:13。童鞋们跟我一起玩。1. 把LibSVM包解压到相应的目录,比如 D:/lab/libsvm/。2. 在电脑“开始”的“运行”中输入cmd,进入DOS命令提示符环境。定位到d:/la
2013-10-12 10:19:18
947
转载 svm理论与实验之11:svm开发工具包LibSVM
svm理论与实验之11:svm开发工具包LibSVM徐海蛟博士 Teaching.光说不练,很难真正理解svm的妙处,也难以真正实用。所以,有必要跟着徐海蛟老师一起练习svm。svm理论和工具已经很成熟了。童鞋们并不需要手写每一行代码。一个非常好用的开发工具包是LibSVM,支持C++、Java、Matlab语言。libSVM只是众多SVM实现版本中的其中之一。LibS
2013-10-11 21:54:26
1863
转载 svm理论与实验之10: SVM多类分类
徐海蛟博士 Teaching.从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外,例如垃圾邮件过滤,就只需要确定“是”还是“不是”垃圾邮件),比如文本分类,比如数字识别。如何由两类分类器得到多类分类器,就是一个值得研究的问题。 还以文本分类为例,现成的方法有很多,其中一种一劳永
2013-10-11 16:46:39
1641
转载 svm理论与实验之9:惩罚因子C
svm理论与实验之9:惩罚因子C徐海蛟博士 Teaching.回想一下C所起的作用(表征你有多么重视离群点,C越大越重视,越不想丢掉它们)。这个式子是以前做SVM的人写的,大家也就这么用,但没有任何规定说必须对所有的松弛变量都使用同一个惩罚因子,我们完全可以给每一个离群点都使用不同的C,这时就意味着你对每个样本的重视程度都不一样,有些样本丢了也就丢了,错了也就错了,这些就给一个比较
2013-10-11 16:12:43
2990
转载 svm理论与实验之8:松弛变量
徐海蛟博士 Teaching.现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了)。现在想象我们有另一个训练集,只比原先这个训练集多了一篇文章,映射到高维空间以后(当然,也使用了相同的核函数),也就多了一个样本点,但是这个样本的位置是这
2013-10-11 15:42:21
1044
转载 svm理论与实验之7: 核函数
徐海蛟博士 Teaching. 之前一直在讨论的线性分类器,器如其名(汗,这是什么说法啊),只能对线性可分的样本做处理。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必然使得它的适用范围大大缩小,而它的很多优点我们实在不原意放弃,怎么办呢?是否有某种方法,让线性不可分的数据变得线性可分呢? 有!其思想说来也简单,来用一个二维平面
2013-10-10 16:26:59
967
转载 svm理论与实验之6: 线性分类器的求解(续集) — 问题的转化
徐海蛟博士 Teaching. 让我再一次比较完整的重复一下我们要解决的问题:我们有属于两个类别的样本点(并不限定这些点在二维空间中)若干, 圆形的样本点定为正样本(连带着,我们可以把正样本所属的类叫做正类),方形的点定为负例。我们想求得这样一个线性函数(在n维空间中的线性函数): g(x)=wx+b 使得所有属于正类的点x+代入以后有g(x+
2013-10-10 16:03:36
684
转载 svm理论与实验之5: 线性分类器的求解
徐海蛟博士 Teaching.一个求最小值的问题就是一个优化问题(也叫寻优问题,更文绉绉的叫法是规划——Programming),它同样由两部分组成,目标函数和约束条件,可以用下面的式子表示: (式1) 约束条件用函数c来表示,就是constrain的意思啦。你可以看出一共有p+q个约束条件,其中p个是不等式约束,q个等式约束。 关于这个式子可
2013-10-10 12:23:48
1141
转载 svm理论与实验之4 — 问题的描述
徐海蛟博士 Teaching.上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔和几何间隔的定义: 间隔:δ=y(wx+b)=|g(x)| 几何间隔: 可以看出δ=||
2013-10-10 12:01:49
871
转载 svm理论与实验之3: 线性分类器(续集)
徐海蛟博士 Teaching对于文本分类这样的不适定问题(有一个以上解的问题称为不适定问题),需要有一个指标来衡量解决方案(即我们通过训练建立的分类模型)的好坏,而分类间隔是一个比较好的指标。 在进行文本分类的时候,我们可以让计算机这样来看待我们提供给它的训练样本,每一个样本由一个向量(就是那些文本特征所组成的向量)和一个标记(标示出这个样本属于哪个类别)组成。如下:
2013-10-09 21:57:07
1111
java api7.0最新伪中文chm
2013-10-26
hadoop 1.2.1 api 最新chm 伪中文版
2013-10-25
gnuplot 4.6 绘图软件2013最新版New
2013-10-12
Python 2.7
2013-10-12
iPhone开发教程2013New!(下集11-完)
2013-09-28
2013大数据与数据智能时代
2013-09-28
大数据时代的三大发展趋势及投资方向
2013-09-28
云计算与大数据入门
2013-09-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人