
机器学习
且行切记
心易-用心才能改变
展开
-
逻辑回归数学推倒讲解
the logistic function公式θ=es1+es\theta=\frac{e^s}{1+e^s} 其中入参是s,也就是神经元的信号s=WTXW^TX, 它的意思是归类到目标分类的概率是多少。这个公式也叫sigmoid,因为他是平滑的临界值。现在我们有h(x)=θ(s)\theta(s),这个被解释为一个概率的含义,举个例子,比如心脏病的概率是多少。 输入为一个向量x: 血脂水平,年龄原创 2016-04-23 08:22:50 · 1857 阅读 · 0 评论 -
pycuda 的安装指南
pycuda 的安装指南** 安装依赖的Visual Studio Professional 2008,下载地址https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi安装后,直接使用pip安装 numpy,和 pycuda即可,比较简单。这里的挑战是如果你原创 2016-08-24 00:43:23 · 1288 阅读 · 1 评论 -
Approaching (Almost) Any Machine Learning Problem
上周一个叫 Abhishek Thakur 的数据科学家,在他的 Linkedin 发表了一篇文章 Approaching (Almost) Any Machine Learning Problem,介绍他建立的一个自动的机器学习框架,几乎可以解决任何机器学习问题,项目很快也会发布出来。这篇文章迅速火遍 Kaggle,他参加过100多个数据科学相关的竞赛,积累了很多宝贵的经验,看他很幽默地说“写这样转载 2017-05-11 12:07:00 · 2521 阅读 · 0 评论 -
python 虚拟环境安装和使用
python 虚拟环境安装和使用创建虚拟环境virtualenv –system-site-packages targetDirectory 激活环境source ~/xxx/bin/activate去激活deactivate原创 2017-05-06 12:38:19 · 364 阅读 · 0 评论 -
反向传播算法中应用正则化参数---正则化概念学习1
反向传播算法中应用正则化参数—正则化概念学习1原创 2017-09-25 03:06:23 · 1350 阅读 · 0 评论 -
吴恩达神经网络反向传播算法matlab作业疑问的解答
吴恩达神经网络反向传播算法matlab作业疑问原创 2017-09-17 10:47:59 · 1113 阅读 · 0 评论 -
CUDA随机数模块 无法编译通过问题
CUDA随机数库的使用 深度学习过程中经常需要使用随机数, CUDA提供了一个高性能的随机函数库,如果要使用的话,可能有些坑你会遇到。具体步骤如下:#include原创 2017-10-30 23:35:23 · 402 阅读 · 0 评论 -
如何建立一个GPU加速的研究计算集群(二)
4 . 主节点安装建议使用开源的操作系统 Rocks Linux distribution来安装主节点,Rocks 是一个高可定制化,易于安装的适合集群计算的操作系统,它默认安装集群计算组建例如MPI, 安装文档地址如下:Rocks user guide,这里我仅仅罗列下基本的安装步骤:根据第三章的步骤进行基于CD的安装。安装NVIDIA和CUDA的环境包以及工具安装内部网络网卡驱动...原创 2018-06-20 23:05:54 · 4298 阅读 · 0 评论 -
如何使用matlab访问数据库,并且传入带参数的查询语句
如何使用matlab访问数据库,并且传入带参数的查询语句错误场景:最近在使用matlab构建基于机器学习的金融数据分析模型,遇到一个查询sqlite数据库的场景,通常使用matlab查询数据库的办法是如下语句:conn_index = sqlite(index_db,'readonly');sql_find_max_number_n='select max(overall_ind...原创 2018-07-04 12:13:28 · 1365 阅读 · 0 评论 -
如何从零配置高效的tensorflow python编程环境之VIM神的编辑器---DIY自己的VIM
Title: 如何从零开始在WIN10上编译安装vim并配置python开发环境Summary: 毫无遗漏的将每个步骤都记录下来Authors: Jason zhaoDate: 2018年9月24日08点04分DIY自己的VIM在windows下编译安装的前提是:** 你必须安装了vs2017 comunity or 收费版本 **因为我们的目的是建立支持python开发的...原创 2018-09-25 07:55:07 · 889 阅读 · 0 评论 -
神经网络训练新的之特征工程尽量不要加入过多的格式转换(从浮点到文本,再从文本到浮点)
神经网络训练日志今日正在编写的样本生成工具处理的非常慢,并且随着数量越来越慢,通常要几个小时,检查原因居然是numpy框架的concatenate函数效率低下,说白了这是个小白问题,它在不断重新扩大数组的大小,所有数据都要重新编排数组下标。first_array = np.concatenate((first_array, features_of_row), ...原创 2018-10-12 13:49:38 · 536 阅读 · 0 评论 -
numpy 小数类型的样本数据如何保存到文件
小数类型的样本数据如何保存到文件问题:自己含辛茹苦生成的样本数据,如果是自己的格式保存的,numpy读取会比较麻烦,如果通过Numpy.savetxt 写入的,则会造成读取的时候数据不一致的问题,如果用二进制写入的话,会造成跨平台的问题。有一种跨平台的方法就是用numpy自己的格式,.npy. 具体代码如下In [8]: np.save('test3.npy', a) # .n...原创 2018-09-29 19:31:37 · 1812 阅读 · 0 评论 -
CUDA CUBLAS第一个程序 漂亮的VIM
终于搞定了cublas的环境调试原创 2016-05-03 13:39:54 · 851 阅读 · 0 评论 -
vim cuda语法高亮
vibing搜索后,发现使用下面的办法:Add these two lines to ~/.vimrc:au BufNewFile,BufRead *.cu set ft=cudaau BufNewFile,BufRead *.cuh set ft=cudaAnd put http://vim.cybermirror.org/runtime/syntax/cuda.vim in ~/.vim/sy原创 2016-05-02 22:48:06 · 1392 阅读 · 0 评论 -
深度学习中梯度下降知识准备
考虑一个代价函数C , 它根据参数向量 计算出当前迭代模型的代价,记作C(). 机器学习中,我们的任务就是得到代价的最小值,在机器学习中代价函数通常是损失函数的均值,或者是它的数学期望。见下图:这个叫做泛化损失,在监督学过程中,我们知道z=(x,y) ,并且 f(x) 是对y的预测。什么是这里的梯度呢?当 是标量的时候,代价函数的梯度可表示如下:当原创 2014-12-17 21:38:15 · 1864 阅读 · 0 评论 -
机器学习大总结(1)
智能:智能这个词可以用很多方法去定义。这里我们把它定义为能够根据某些情况做出正确的决定。做出好的决策需要知识,并且这种知识必须是一种可操作的,例如解释传感器数据并且使用它去做决策。人工智能:感谢那些人类曾经写过的程序,允许这些程序去做一些我们认为有用的事情。在这种情况下,计算机已经获得了某种程度的智能。在21世纪的开始的时候了,仍然有很多任务,人和动物可以很简单做到,而计算机却原创 2014-12-13 09:45:18 · 1483 阅读 · 0 评论 -
深度学习入门介绍系列1
深度学习概述深度:从输入产生一个输出的计算,可以被一个有向图来表达:一个有向图是一个表达计算的图,每个节点表达一个计算元素和一个值(计算结果,就是根据该节点的孩子节点的值计算的)。每一个节点和可能的图结构组成的计算集合就定义了一个函数系列。输入节点没有孩子节点,输出节点没有父亲节点。下面表达sin(a^2+b/a)的有向图可以通过两个输入节点a,b,一个表达b/a的节点原创 2014-12-13 12:10:43 · 2202 阅读 · 0 评论 -
深度学习入门介绍系列2
注:此页是一个引导的页面,后续将会分7个主要教程和一些高级的例子,一步一步讲解深度学习。这里的教程将为大家提供最重要的几个深度学习算法,并且也会告知如何去用theano来运行它们。theano是一个python类库,它能够帮助大家容易的去写深度算法模型,并且可以让大家能够在GPU上运行这些算法学习这些教程之前,需要熟悉下先热下身,这里是theano的基础教程,学完之后,再看下这个东原创 2014-12-14 11:41:26 · 1900 阅读 · 0 评论 -
深度学习之机器学习傻瓜教程
什么是机器学习?传统的教科书会用一大堆高等数学,线性代数,概率论,统计学等知识把你拒之门外,这里博主俺决定用一个很简单的例子给不用你任何高深的数学知识来理解。 在写机器学习之前,我们来举个例子。假设你是个古代的国王,那里没有现代的科技,你想找个预报天气比较准的人来帮你预报天气。你要怎么办呢?通常,我们会找一个人,让他预报10000天,看它的准确率如何,然后再找一个人,再预报1原创 2014-12-17 22:04:26 · 3676 阅读 · 1 评论 -
如何建立一个GPU加速的研究计算集群(一)
世界上某些最快的计算机是集群组成的。集群是有多个计算机通过高速网络连接起来的一个计算系统。集群计算机比单台计算机可以达到更高的可用性,可靠性和伸缩性。随着对基于GPU的高性能计算采用越来越广,英伟达GPU逐渐成为世界上最厉害的超级计算集群的一部分。世界前500的超级计算机中,包括差不多50个采用了英伟达的的GPU,并且目前世界上最快的计算机泰坦,使用了大约18000个英伟达开普勒GPU。在这个帖子中原创 2015-03-02 22:31:49 · 11370 阅读 · 1 评论 -
java 机器深度学习网站
http://deeplearning4j.org/它是第一个商业应用级的开元,分布式深度学习框架,最主要的是java写的,并且也可以用scala.它和hadoop , spark都能整合, DL4J是为商业环境而设计的东东,也支持CUDA编程.前些日子用theano, 总是感觉不成熟,各种bug不断.原创 2015-03-30 01:13:53 · 1737 阅读 · 0 评论 -
简单卷积神经网络讲解
卷积神经网络动机CNN是一个从生物启发而创建出来的一个多层神经网络,它是hubel 和wiesel共同搞定的。我们知道视觉皮层包含一个复杂的细胞排列。这些细胞对子区的视觉区域比较敏感,叫做易接受区域。这些细胞在这些输入空间上扮演了一个本地过滤器的窘册,并且是一个非常适合强空间本地纠正,在自然图像上。另外,两个基本细胞类型已经被证实了:简单细胞 负责最大化的去描述物体的边的模式,在他的可接受区域。复杂原创 2016-01-02 18:34:53 · 2303 阅读 · 0 评论 -
加州理工学院机器学习课程目录
第九章逻辑回退原创 2016-04-10 19:06:03 · 466 阅读 · 0 评论 -
theano logistic regression讲解之续模型测试
模型测试正如在训练模型一节解释的,我们还需要关注在分类过程中,实际分类错误的数目。上面的LogisticRegression 类增加了两个附加的方法,允许去得到每一个迷你批次里实际错误分类的样本书。 代码如下:def errors(self, y): """Return a float representing the number of errors in the minibat原创 2016-04-09 07:46:36 · 1146 阅读 · 0 评论 -
theano logistic regression讲解
theano logistic regression讲解逻辑模型是一个基于概率的线性分类器。它的参数是w和b。 通过把输入向量映射到一个超平面集合上来实现分类,每个超平面对应一个分类。从超平面到输入向量的距离反应了这个概率,就是说输入属于这个分类的概率。数学上,一个输入属于某个分类的公式可以表达为下面的公式: 这个公式的意思是,当已知一个输入x,根据猜想的参数(w,b)得到的softmax就是原创 2016-04-07 07:54:15 · 1172 阅读 · 1 评论 -
hololens三大技术原理
房间布局以及物品的探测hololense需要能够探测到房间的布局,以及房间的墙壁,家电等物品的图像识别算法。以及通过扫描构建房间三维空间的能力。人体位置感应hololense必须能够探测到人体的扭动和位移,这样才能精确地将虚拟物品和人看到的物品贴合起来。虚拟物体投射hololense必须能够将WIN10里的虚拟物体,投射到头盔的眼镜上才可以让人眼看到,据了解,能看到的区域还是比较小,分辨率也比较低。原创 2016-04-10 12:27:34 · 7216 阅读 · 0 评论 -
如何解决tensorflow restore model恢复模型经常出错,模型无法挪动位置的问题
如何解决tensorflow restore model恢复模型经常出错,模型无法挪动位置的问题如果你想保存使用tensorflow训练过的模型的话,你大概需要用tensor.saver,但是它却又很多麻烦:如果你将此模型拷贝到另一个目录,再加载到内存中进行训练的话,将无法使用。还有就是你的加载模型的代码和原来训练它使用的代码计算图如果稍有不同,则会导致变量找不到,又无法加载。第一条问...原创 2018-10-26 00:48:13 · 1265 阅读 · 0 评论