
机器学习算法笔记
cs24k1993
这个作者很懒,什么都没留下…
展开
-
Ubuntu 安装 NVIDIA 驱动后无法进入桌面(循环进入登录界面 )
1,先按以下操作:开机,在 GRUB 选择界面按 E,这时界面变成了一个编辑器。在倒数几行找到 ro quiet splash然后删掉quiet,改成text,接着按F10这时你已进入操作系统(ctrl+alt+F1-F6),输入用户名密码登录。2,然后输入以下代码:sudo add-apt-repository ppa:bumblebee/stablesudo ap...转载 2018-02-20 15:56:20 · 10128 阅读 · 0 评论 -
Python接口调用已训练好的 caffemodel 测试分类
训练好caffemodel后,需要测试模型分类的正确率,caffe 有 python接口,可以调用已训练好的caffemodel测试分类。 有以下几点需要注意:1, 需要修改 net.prototxt 文件为 deploy.prototxt 文件,方法见我的另一个博客。deploy= '/home/justin/cnn-human/code/deploy.prototxt' #结构文原创 2018-01-04 19:22:47 · 2104 阅读 · 0 评论 -
Caffe中用训练好的模型测试,deploy文件的修改方法
训练好网络模型后,需要在测试集上验证模型分类的正确率,这时,就需要把训练的网络文件net.prototxt修改为deploy.prototxt,然后再进行测试。输入数据层改动如下:name: "SpecNet"layer { name: "spectr" type: "Data" top: "data" top: "label" include { phase原创 2018-01-04 18:49:30 · 2806 阅读 · 0 评论 -
Over-fitting、under-fitting 与 regularization
机器学习中一个重要的话题便是模型的泛化能力,泛化能力强的模型才是好模型,对于训练好的模型,若在训练集表现差,不必说在测试集表现同样会很差,这可能是欠拟合导致;若模型在训练集表现非常好,却在测试集上差强人意,则这便是过拟合导致的,过拟合与欠拟合也可以用 Bias 与 Variance 的角度来解释,欠拟合会导致高 Bias ,过拟合会导致高 Variance ,所以模型需要在 Bias 与 Vari转载 2018-01-21 14:25:09 · 525 阅读 · 0 评论 -
Caffe 中 solver.prototxt 和 train_test.prototxt 参数详解
A. solver.prototxt:net:训练预测的网络描述文件,train_test.prototxt test_initialization:取值为true或者false,默认为true,就是刚启动就进行测试,false的话不进行第一次的测试。test_iter:在测试的时候,需要迭代的次数,即test_iter* batchsize(测试集的)>=测试集的大小,测...转载 2017-12-26 20:44:51 · 2303 阅读 · 0 评论 -
Caffe命令及其参数解析
caffe的c++主程序(caffe.cpp)放在根目录下的tools文件夹内, 当然还有一些其它的功能文件,如:convert_imageset.cpp, train_net.cpp, test_net.cpp等也放在这个文件夹内。经过编译后,这些文件都被编译成了可执行文件,放在了 ./build/tools/ 文件夹内。因此我们要执行caffe程序,都需要加 ./build/tools/ 前缀。转载 2017-12-25 16:49:08 · 313 阅读 · 0 评论 -
Caffe的solverstate的使用
我们在使用caffe训练过程中会生成.caffemodel和.solverstate文件,一个是模型文件,一个是中间状态文件(生成多少个取决于你自己设定的snapshot)。当训练过程中断,你想继续运行数据学习,此时只需要调用.solverstate文件即可。使用方式代码,我使用的是.sh直接运行,配置和官方给的文件train_caffenet.sh差不多,稍微添加点内容就可以了。 ./build转载 2017-12-24 12:02:00 · 1631 阅读 · 0 评论 -
Caffe之solver.prototxt文件参数设置
caffe solver参数意义与设置batchsize:每迭代一次,网络训练图片的数量,例如:如果你的batchsize=256,则你的网络每迭代一次,训练256张图片;则,如果你的总图片张数为1280000张,则要想将你所有的图片通过网络训练一次,则需要1280000/256=5000次迭代。epoch:表示将所有图片在你的网络中训练一次所需要的迭代次数,如上面的例子:5000次;我们称之为转载 2017-12-21 17:33:14 · 401 阅读 · 0 评论 -
Caffe绘制训练过程的loss和accuracy曲线
在caffe的训练过程中,大家难免想图形化自己的训练数据,以便更好的展示结果。如果自己写代码记录训练过程的数据,那就太麻烦了,caffe中其实已经自带了这样的小工具 caffe-master/tools/extra/parse_log.sh caffe-master/tools/extra/extract_seconds.py和 caffe-master/tools/extra/plot_trai转载 2017-12-21 17:12:00 · 274 阅读 · 0 评论 -
L1,L2正则化的区别
1,L1会趋向于产生少量的特征,而其他不重要的特征都为0,会产生稀疏性,可以用来选择特征,也能一定程度上防止过拟合。而L_2会选择更多的特征,特征值都趋近于0,防止过拟合。Lasso在选择特征时非常有用,而Ridge就只是规则化而已。所以在所有特征中只有少数特征起重要作用的情况下,选择Lasso进行特征选择。而所有特征中大部分特征都能起作用,而且作用很平均,那么使用Ridge会更合适。2,...原创 2018-03-24 23:46:07 · 348 阅读 · 0 评论 -
PCA,LDA,SVD的定义与联系
如果不降维,将导致 数据分布在一个极小的区域内。也叫维度灾难。比如说,球的体积是 v 正比于 R^3。在R/2的同心球,体积正比于(R/2)^3。同心小球是全球的体积八分之一。如果是多维球,球的大部分体积 分布在球表面内侧的“很薄”的一层,比如千/万维的话….所以要降维。不降维,高维特征没啥用,比如人脸识别….PCA是无类别信息,不知道样本属于哪个类,用PCA,通常对全体数据操作。PCA的计...原创 2018-04-19 10:13:57 · 1246 阅读 · 2 评论 -
Ubuntu14.04更改为NVIDIA显卡驱动之后黑屏的问题
今天在Ubuntu更新NVIDIA显卡驱动之后卡在登陆界面就黑屏了,在tty下输入以下命令就可以重新进入桌面。sudo apt-get remove --purge nvidia-* sudo apt-get install ubuntu-desktop sudo rm /etc/X11/xorg.conf 参考:http://blog.youkuaiyun.com/zzycsx/article/de转载 2018-02-20 15:50:26 · 805 阅读 · 0 评论 -
Linux 下 cuda 安装教程
1,首先按照NVIDIA document上的规范,完成post-install。http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions 2,禁掉 nouveau 开源驱动,通过下面的命令检查是不是成功禁止掉开源驱动,若输入命令后shell没有显示其他内容,...转载 2017-12-30 12:04:07 · 6799 阅读 · 0 评论 -
Caffe中convert_imageset的用法解释
1,在/home/justin/caffe/tools路径下,有一个convert_imageset.cpp文件,文件开头讲了convert_imageset的用法,如下所示代码:// This program converts a set of images to a lmdb/leveldb by storing them// as Datum proto buffers.//原创 2017-12-20 11:28:30 · 6744 阅读 · 1 评论 -
让一个 caffe 跑起来的流程及注意事项
需要三个文件,以mnist为例,有这三个 train_lenet.sh,lenet_solver.prototxt,lenet_train_test.prototxt。 总的来说,执行 train_lenet.sh,程序会调用lenet_solver.prototxt,然后调用lenet_train_test.prototxt,再开始训练网络。 ①其中, train_lenet.sh是自己定义原创 2017-12-21 12:13:33 · 333 阅读 · 0 评论 -
Markdown使用技巧总结——字体,颜色,字号,背景,首行缩进等
1,换行: 方法1:连续两个以上空格+回车 方法2:使用html语言换行标签:<br>2,首行缩进两个字符:(每个表示一个空格,连续使用两个即可) 半角的空格。 全角的空格。 3,字体、字号与颜色: Markdown是一种可以使用普通文本编辑器编写的标记语言,通过类似HTML的标记语法,它可以使普通文本内容具有一定的格式。但是它转载 2017-12-25 11:17:26 · 1853 阅读 · 0 评论 -
Pandas中loc,iloc,ix的区别
总结:loc需要传入的是index的label。iloc需要传入的是index的position(行号)ix优先按label索引,如果找不到label,再按position索引。例如:>>> s = pd.Series(np.nan, index=[49,48,47,46,45, 1, 2, 3, 4, 5])>>> s49 NaN48 NaN47 NaN46 NaN45原创 2017-12-26 20:53:23 · 408 阅读 · 0 评论 -
批梯度下降法(Batch Gradient Descent ),小批梯度下降 (Mini-Batch GD),随机梯度下降 (Stochastic GD)
一、梯度下降法 在机器学习算法中,对于很多监督学习模型,需要对原始的模型构建损失函数,接下来便是通过优化算法对损失函数进行优化,以便寻找到最优的参数。在求解机器学习参数的优化算法中,使用较多的是基于梯度下降的优化算法(Gradient Descent, GD)。 梯度下降法有很多优点,其中,在梯度下降法的求解过程中,只需求解损失函数的一阶导数,计算的代价比较小,这使得梯度下降法能在很多转载 2018-01-21 15:29:16 · 22413 阅读 · 3 评论 -
【Caffe安装】ImportError: No module named caffe 的解决方案
1, 在成功编译caffe的源码之后,可以在python环境中使用caffe。在Ubuntu环境下,打开python解释程序,输入import caffe时,可能会出现 ImportError: No module named caffe>>>import caffe Traceback (most recent call last): File "", line 1,原创 2018-01-04 18:17:43 · 6470 阅读 · 0 评论 -
深度学习中如何计算图片数据的均值
图片减去均值后,再进行训练和测试,会提高速度和精度。因此,一般在各种模型中都会有这个操作。那么这个均值怎么来的呢,实际上就是计算所有训练样本的平均值,计算出来后,保存为一个均值文件,在以后的测试中,就可以直接使用这个均值来相减,而不需要对测试图片重新计算。一、二进制格式的均值计算caffe中使用的均值数据格式是binaryproto, 作者为我们提供了一个计算均值的文件compute_转载 2018-01-04 18:29:26 · 3334 阅读 · 0 评论 -
安装CUDA及CAFFE出现的问题及解决办法合集
1,cuda8.0使用nvcc编译程序出现warning:The ‘compute_20’, ‘sm_20’, and ‘sm_21’ architectures are deprecated的解决办法 2,Ubuntu 14.04 关闭桌面3,cuda8.0部署在ubuntu14.04+GTX1080上需要注意的几个问题 4,安装CUDA 出现libEGL.so.1 is not a symbol原创 2017-12-30 12:44:45 · 2255 阅读 · 0 评论 -
Caffe学习系列(1):数据层及参数
要运行caffe,需要先创建一个模型(model),如比较常用的Lenet,Alex等, 而一个模型由多个层(layer)构成,每一层又由许多参数组成。所有的参数都定义在caffe.proto这个文件中。要熟练使用caffe,最重要的就是学会配置文件(prototxt)的编写。层有很多种类型,比如Data,Convolution,Pooling等,层之间的数据流动是以Blobs的方式进行。转载 2018-01-16 16:10:32 · 323 阅读 · 0 评论 -
Caffe学习系列(2):视觉层(Vision Layers)及参数
所有的层都具有的参数,如name, type, bottom, top和transform_param请参看我的前一篇文章:Caffe学习系列(1):数据层及参数本文只讲解视觉层(Vision Layers)的参数,视觉层包括Convolution, Pooling, Local Response Normalization (LRN), im2col等层。1、Convolution层:转载 2018-01-16 16:24:53 · 220 阅读 · 0 评论 -
特征工程
1,特征工程之缺失值与离群值处理 2,使用sklearn做单机特征工程及特征工程流程 3,机器学习中,有哪些特征选择的工程方法? 4,Discover Feature Engineering, How to Engineer Features and How to Get Good at It? 5,XGBoost参数调优完全指南(附Python代码) 6,XGBoost-Python...原创 2018-04-19 16:06:22 · 223 阅读 · 0 评论