
Machine Learning
文章平均质量分 82
我非英雄
语言温和不等于没有个性,外表温和不等于没有傲骨。
展开
-
linux python 安装 nose lapack atlas numpy scipy
The first step of machine larning .环境配置:原创 2014-10-26 15:55:32 · 5709 阅读 · 0 评论 -
机器学习实战-k近邻算法
1.k-近邻算法概念k-近邻算法主要原理:假设有一个样本集,并且知道数据的类别,对于一个新来的数据,通过计算新数据与已知样本集数据的距离,距离越近越相似。选出k个最相似的数据,在这k个数据中,出现最多的类别作为新数据的类别。2.code代码实现: 现有a,b类别的数据点 a1=(1,1),a2=(1,1.2),b1=(3,3),b2=(3,3.1)a_1=(1,1),a_2=(1,1原创 2015-03-31 16:30:08 · 650 阅读 · 0 评论 -
机器学习实战-PCA主成分分析、降维
降维技术很多时候,原始数据是多维度的,在计算的时候会带来很大的资源开销。而且数据本身有很多的冗余,我们可以去除一些不必要的特征,使得数据简化,降低算法的计算开销。因此需要利用降维技术来实现。PCA(Principal Component Analysis)主成分分析在PCA中,数据从原来的坐标系转化到新的坐标系中。当然这里新的坐标系也不是随便设定的,而是应该根据数据本身的特征来设计。通常第一个新坐标原创 2015-04-09 23:14:19 · 3384 阅读 · 1 评论 -
Linux下安装scikit-learn numpy scipy
scikit-learnScikit-Learn是基于python的机器学习模块,其安装依赖numpy scipy等模块。 官方文档介绍有如下依赖: Scikit-learn requires: Python (>= 2.6 or >= 3.3), NumPy (>= 1.6.1), SciPy (>= 0.9). 之前写过一篇linux下安装 numpy sci原创 2015-05-30 16:24:06 · 8329 阅读 · 0 评论 -
机器学习实战-决策树
决策树概述关于决策树的原理,网上有个有趣的比喻,这里直接搬过来吧。讲的是母亲给女儿介绍对象的对话。 女儿:多大岁数了? 母亲:26 女儿:帅么? 母亲:帅。 女儿:高么? 母亲:高。 女儿:有钱么? 母亲:有钱的。 女儿:好,那见个面吧。这个对话是yy的~~哈哈:D,这个对话的过程就像是一个决策树的过程,每一个问题就像是一个决策的节点。女儿根据这原创 2015-04-02 16:20:24 · 830 阅读 · 0 评论 -
机器学习实战-朴素贝叶斯算法
朴素贝叶斯概述朴素贝叶斯也是一个强大的分类算法。其基本原理:假设现在有1,2,3,3种类别,现有一个数据a,其属于这个3种类别的概率分别为p1(a),p2(a),p3(a)p_1(a),p_2(a),p_3(a)。如果这3个概率中p1(a)p_1(a)最大,那么就把数据a归为1类。 这道理好简单啊,就算我们猜谜语也会猜一个可能性最大的嘛~~~ 果然很朴素啊,但是呢,这里还是有一个问题的,这里的3原创 2015-04-03 13:01:00 · 1643 阅读 · 0 评论 -
机器学习-Kaggle竞赛-Digit recognizer
第一次接触Kaggle比赛。从练习区开始~~~ 做了一个最简单的手写数字识别练习(Digit Recognizer)。 尝试了用KNN,bayes,Logistic Regression。 首页拿到练习数据,digit-recognizer-data 下载train.csv test.csv文件 train.csv train.csv里面是42000*785的数据 每一行代表一个图原创 2015-07-04 10:16:24 · 2965 阅读 · 0 评论 -
机器学习-Kaggle竞赛-Titanic
1912.04.15 泰坦尼克号沉没,成为人类历史上重大海难事件之一。 …… 没有足够的救生船,以及部分船没有载满就离开了。导致了大量的游客遇难。 根据幸存者的信息,试图寻找哪些人更容易逃生~~信息解读train.csv test.csv 首先下载2个数据文件。 PassengerId//游客id Survived//1幸存 Pclass//1 2 3 表示社会地位原创 2015-07-18 11:55:30 · 1658 阅读 · 0 评论 -
机器学习实战-Logistic回归
最近在看《机器学习实战》这本书。机器学习的算法总免不了一堆数学公式的推导,看起来还是比较晦涩难懂。看看网友的文章再自己翻翻高数的书本,尝试自己推导下,总算有点明白了,写下来再加深下理解。Logistic回归属于优化类的算法。Logistic回归的主要思想:根据现有的数据对分类边界线建立回归公式,达到分类的目的。假设我们有一堆数据,需要划一条线(最佳直线)对其分类,这就是Logistic回归的目的了。原创 2015-03-28 11:22:38 · 1590 阅读 · 2 评论