
机器学习
谁主沉浮---data
小小大数据
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习and决策树学习笔记
在 IBM Bluemix 云平台上开发并部署您的下一个应用。开始您的试用机器学习概念机器学习 (Machine Learning) 是近 20 多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动学习的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进原创 2017-03-09 16:32:28 · 587 阅读 · 0 评论 -
机器学习十大算法(1)
通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地解析。今天的算法如下:决策树随机森林算法逻辑回归SVM朴素贝叶斯K最近邻算法K均值算法原创 2017-03-21 11:36:48 · 584 阅读 · 0 评论 -
机器学习十大算法(2)
2. 随机森林在源数据中随机选取数据,组成几个子集S 矩阵是源数据,有 1-N 条数据,A B C 是feature,最后一列C是类别由 S 随机生成 M 个子矩阵这 M 个子集得到 M 个决策树将新数据投入到这 M 个树中,得到 M 个分类结果,计数看预测成哪一类的数目最多,就将此类别作为最后的预测结果原创 2017-03-21 11:38:48 · 525 阅读 · 0 评论 -
机器学习十大算法(3)
3. 逻辑回归当预测目标是概率这样的,值域需要满足大于等于0,小于等于1的,这个时候单纯的线性模型是做不到的,因为在定义域不在某个范围之内时,值域也超出了规定区间。所以此时需要这样的形状的模型会比较好那么怎么得到这样的模型呢?这个模型需要满足两个条件 大于等于0,小于等于1大于等于0 的模型可以选择 绝对值,平方值,这里用 指数函数,一定大于0小于等原创 2017-03-21 11:41:39 · 433 阅读 · 0 评论 -
机器学习十大算法(4)
4. SVMsupport vector machine要将两类分开,想要得到一个超平面,最优的超平面是到两类的 margin 达到最大,margin就是超平面与离它最近一点的距离,如下图,Z2>Z1,所以绿色的超平面比较好将这个超平面表示成一个线性方程,在线上方的一类,都大于等于1,另一类小于等于-1点到面的距离根据图中的公式计算所以得到 total原创 2017-03-21 11:44:08 · 494 阅读 · 0 评论 -
人工智能、机器学习、数据挖掘、神经网络等学科的关系概述
机器学习:强调学习能力,机器在算法的指导下有一点的学习能力,比如神经网络,训练算法统计分析:从统计的角度出发,发现系统的规律,比如线性回归等,不过神经网络也可以看作一种非线性回归。数据挖掘:强调的是从一大堆数据里有价值的数据,比如最赚钱的信息,指标,比如,啤酒尿布要放一块,为了挖掘有价值的信息,当然所有方法都会用上。神经网络:强调模拟生物神经系统,尤其是大脑的神经网络。比如:BP网络,原创 2017-03-21 14:39:13 · 1188 阅读 · 0 评论