
机器学习
bug搬运攻城狮
当你的才华还撑不起你的野心时,你就应该静下心来学习
展开
-
机器学习算法一览
机器学习算法一览图 一般说来,机器学习有三种算法:1. 监督式学习监督式学习算法包括一个目标变量(因变量)和用来预测目标变量的预测变量(自变量)。通过这些变量我们可以搭建一个模型,从而对于一个已知的预测变量值,我们可以得到对应的目标变量值。重复训练这个模型,直到它能在训练数据集上达到预定的准确度。属于监督式学习的算法有:回归模型,决策树,随机森林,K邻近算法,逻辑回归等。...原创 2018-07-06 15:34:26 · 832 阅读 · 0 评论 -
决策树实战篇
二 决策树构建 上篇文章也粗略提到过,构建决策树的算法有很多。篇幅原因,本篇文章只使用ID3算法构建决策树。1 ID3算法 ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。具体方法是:从根结点(root node)开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子节点;再对子结点递归地调用以上方法,构...原创 2018-06-19 11:06:55 · 1153 阅读 · 0 评论 -
决策树基础篇
1. 什么是决策树/判定树(decision tree)? 判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。 2. 机器学习中分类方法中的一个重要算法3. 构造决策树的基本算法 ...原创 2018-06-15 16:59:36 · 301 阅读 · 0 评论 -
K-NN
1.1 k-近邻法简介 下面通过一个简单的例子说明一下:如下图,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。 由此也说明了KNN算法的结果很大程度取决于K的选择。 k近邻法(k-nearest neighbor, k-NN)是1967年由Co...原创 2018-06-15 14:52:06 · 1190 阅读 · 0 评论 -
Logistic回归模型 (二)
上一篇基本是东拼西凑的,(根本原因是我自己没吃透Logistic回归) 今天再来谈谈吧,首先我就不对Logistic回归进行定义的解释的。但是需要强调的一点就是Logistic回归的功能。我们必须要知道它是用来干啥的,上一篇也有提到它就是用来搞二分类使的,就像咱们计算语言似的,最开始只有“0”“1”,我们利用Logistic回归就是将这两个玩意给分开。但是说到本质,它却又是回归,对吧之前讲过线性回原创 2018-01-18 18:34:58 · 594 阅读 · 0 评论 -
Logistic回归模型
个人认为这个玩意水很深啊,还没摸透呢,也是看了一些别人的博客自己再总结一下然后看到有的博客扯到《机器学习实战》这本书,我点进去看了一下,对于我这英文水准比较烂的人来说,完全是两眼一抹黑啊什么是逻辑回归?Logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlin原创 2018-01-17 16:46:03 · 907 阅读 · 0 评论 -
深入剖析回归(二)L1,L2正则项,梯度下降
一、回归问题的定义回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系。回归模型是表示输入变量到输出变量之间映射的函数。回归问题的学习等价于函数拟合:使用一条函数曲线使其很好的拟合已知函数且很好的预测未知数据。回归问题分为模型的学习和预测两个过程。基于给定的训练数据集构建一个模型,根据新的输入数据预测相应的输出。回归问题按照输入变量的个数可以分为一元回归和多元回归;按原创 2018-01-16 18:13:27 · 9653 阅读 · 1 评论 -
线性回归原理(一)
线性回归可以说是机器学习中最基本的问题类型了,这里就对线性回归的原理和算法做一个小结。1. 线性回归的模型函数和损失函数 线性回归遇到的问题一般是这样的。我们有m个样本,每个样本对应于n维特征和一个结果输出,如下: (x(0)1,x(0)2,...x(0)n,y0),(x(1)1,x(1)2,...x(1)n,y1),...(x(m)1,x(m)2,...x(m转载 2018-01-12 17:08:20 · 769 阅读 · 0 评论 -
线性回归实战
不多说上干货!数据暂时还不知道怎么上传:你们自己造一点数据吧,文件名字:Advertising.csv数据格式如下图:import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.model_select原创 2018-01-12 17:20:10 · 1281 阅读 · 0 评论 -
机器学习的算法分类与理解(一)
本文转载别人的,我看了一下挺不错的,介绍了机器学习中一些成员,我认为我们在学习一个东西时,就要先知道他是个什么东西能做些什么东西废话不多说 广义来说,有三种机器学习算法1、 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一...转载 2018-01-12 11:03:28 · 455 阅读 · 0 评论 -
机器学习入门篇
题外话:第二次纯手打编辑博客啦!以下内容摘自百度百科:AI概念:人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。机器学习:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究...原创 2018-11-05 09:02:05 · 319 阅读 · 0 评论