
机器学习
thystar
这个作者很懒,什么都没留下…
展开
-
简单易学的机器学习算法——Apriori算法
一、关联分析 最初接触到数据挖掘的朋友肯定都听说过这样的一个案例:啤酒和尿布。大意是将啤酒和尿布放在一起的销售会提高。其实这背后隐含的原理就是关联分析,简单来讲就是啤酒和尿布之间存在着某种关联关系。关联关系时指从大规模的数据集中寻找物品之间的隐含关系,有时关联分析也可以称为关联规则学习。二、关联分析的重要概念 关联分析主要要做的工作是在大规模数据集上找到某些关系转载 2014-12-16 16:39:39 · 940 阅读 · 0 评论 -
七月算法机器学习笔记6 -- 工作流程与模型优化
这套笔记是跟着七月算法四月机器学习班的学习而记录的,主要记一下我再学习机器学习的时候一些概念比较模糊的地方,具体课程参考七月算法官网:http://www.julyedu.com/特征工程总结模型选择没有那种模型是万能的,在特定情况下选择适合的模型 对这幅图做如下解释 从start开始,先看数据的训练样本 在数据样本比较小的情况下,需要添加更多样本或放弃机器学习,用人工规则处理。 当样原创 2016-11-19 14:17:21 · 995 阅读 · 0 评论 -
七月算法机器学习笔记5 -- 特征工程
这套笔记是跟着七月算法四月机器学习班的学习而记录的,主要记一下我再学习机器学习的时候一些概念比较模糊的地方,具体课程参考七月算法官网:http://www.julyedu.com/特征工程特征 => 数据中抽取出来的对结果预测有用的信息 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。 数据与特征处理 特征处理中不同类型的的特征的处理数值原创 2016-11-12 13:16:20 · 1891 阅读 · 2 评论 -
七月算法机器学习笔记2--机器学习中的数学之矩阵分析与应用
这套笔记是跟着七月算法四月机器学习班的学习而记录的,主要记一下我再学习机器学习的时候一些概念比较模糊的地方,具体课程参考七月算法官网:http://www.julyedu.com/ 矩阵分析与应用主要介绍的内容有:如图首先,来看两个示例:原创 2016-10-29 14:51:08 · 3032 阅读 · 0 评论 -
七月算法机器学习笔记4--线性回归与逻辑回归
这套笔记是跟着七月算法四月机器学习班的学习而记录的,主要记一下我再学习机器学习的时候一些概念比较模糊的地方,具体课程参考七月算法官网:http://www.julyedu.com/ 1 线性回归概念:一般做连续值变量的预测,如股票价格走势等对于预测阶段举例来说:房子的面积与价格的关系如下表所示:可以得到如下图:可以近似画出右边的直原创 2016-06-18 10:21:10 · 1179 阅读 · 0 评论 -
七月算法机器学习笔记3--凸优化
这套笔记是跟着七月算法四月机器学习班的学习而记录的,主要记一下我再学习机器学习的时候一些概念比较模糊的地方,具体课程参考七月算法官网:http://www.julyedu.com/ 1. 无约束优化问题1.1 举例首先看一个例子,对于这个方程组,由于b=[0 1 1]' 不在系数组成的列空间内,即因此,这个方程没有解。但是,是否可以找到一个近似解。即原创 2016-05-21 17:26:31 · 7478 阅读 · 0 评论 -
七月算法机器学习笔记1--机器学习中的数学之数理统计和参数估计
数理统计和参数估计首先,看一下概率与统计的关注点概率论问问题的方式:已知总体的可能性,求某种事件发生的概率,如图所示:原创 2016-04-25 18:06:42 · 2970 阅读 · 0 评论 -
降维概述(I)
在现实世界中,很多事物被表示为高维数据——如语音信号,图像,视频,文本文档,手写字母或数字,指纹和高光谱图像等。 我们通常需要分析和处理大量的数据,For instance, 我们需要鉴别person‘s fingerprint, 通过keyword在网络中搜索文档,去发现图像中某些潜在的模式,从视频中跟踪物体等等。 To complete these tasks, we develop syst原创 2014-12-12 14:38:30 · 2802 阅读 · 1 评论 -
简单易学的机器学习算法——lasso
一、lasso 前面已经叙述了基本的线性回归,局部加权线性回归,以及岭回归。其中,局部加权线性回归做的工作就是进行了特征的选择,选择的策略是进行局部的约束;岭回归是采用的正则化的方法进行特征的选择,使用的是。而lasso采用的则是,即lasso是在平方误差的基础上增加:, 0" src="http://latex.codecogs.com/gif.latex?\lambda%3转载 2014-12-05 13:43:32 · 4484 阅读 · 0 评论 -
简单易学的机器学习算法——岭回归(Ridge Regression)
转载地址:http://blog.youkuaiyun.com/google19890102/article/details/27228279 一、一般线性回归遇到的问题 在处理复杂的数据的回归问题时,普通的线性回归会遇到一些问题,主要表现在:预测精度:这里要处理好这样一对为题,即样本的数量和特征的数量时,最小二乘回归会有较小的方差时,容易产生过拟合时,最小二乘回转载 2014-12-05 00:15:55 · 4385 阅读 · 0 评论