
机器学习
探索空间
阿呆阿瓜的日常
展开
-
决策树--信息增益,信息增益比,Geni指数的理解
决策树 是表示基于特征对实例进行分类的树形结构 从给定的训练数据集中,依据特征选择的准则,递归的选择最优划分特征,并根据此特征将训练数据进行分割,使得各子数据集有一个最好的分类的过程。 决策树算法3要素:特征选择决策树生成决策树剪枝 部分理解: 关于决策树生成决策树的生成过程就是 使用满足划分准则的特征不断的将数据集划分为纯度更高,转载 2017-12-22 11:23:58 · 1840 阅读 · 0 评论 -
机器学习总结
本文转自http://www.cnblogs.com/tornadomeet/p/3395593.html前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技转载 2017-12-06 09:49:20 · 743 阅读 · 0 评论 -
用Python实现机器学习算法
用Python实现出来的机器学习算法都是什么样子呢?营长刚好在 GitHub 上发现了东南大学研究生“Lawlite”的一个项目——机器学习算法的Python实现,下面从线性回归到反向传播算法、从SVM到K-means聚类算法,咱们一一来分析其中的Python代码。目录一、线性回归1、代价函数2、梯度下降算法3、均值归一化转载 2017-12-07 13:40:11 · 2122 阅读 · 0 评论 -
sklearn库中的机器学习函数
函数名称均为sklearn库中的函数1.线性回归算法:LinearRegression: 其中常用的有:Ridge:岭回归算法,MultiTaskLasso:多任务LASSO回归算法,ElasticNet:弹性网眼算法,LassoLars:LARS套索算法,OrthogonalMatchingPursuit:正交匹配追踪(OMP)算法, BayesianRidge:贝叶斯岭回归算法转载 2017-12-07 16:16:06 · 2302 阅读 · 1 评论 -
Python & 机器学习之项目实践
机器学习是一项经验技能,经验越多越好。在项目建立的过程中,实践是掌握机器学习的最佳手段。在实践过程中,通过实际操作加深对分类和回归问题的每一个步骤的理解,达到学习机器学习的目的。预测模型项目模板不能只通过阅读来掌握机器学习的技能,需要进行大量的练习。本文将介绍一个通用的机器学习的项目模板,创建这个模板总共有六个步骤。通过本文将学到:端到端地预测(转载 2017-12-26 15:31:00 · 3816 阅读 · 1 评论 -
过拟合(原因、解决方案、原理)
版权声明:如需转载,请注明出处http://blog.youkuaiyun.com/a8198252941.定义标准定义:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比h’小,但在整个实例分布上h’比h的错误率小,那么就说假设h过度拟合训练数据。 —-《Machine Learning》Tom M.Mitchell2.出现过拟合的一些原因(原创 2018-01-22 15:26:44 · 1433 阅读 · 0 评论 -
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1.欧氏距离2.曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离5.标准化欧氏距离6转载 2018-01-16 10:52:32 · 266 阅读 · 0 评论