
机器学习原理及实战
文章平均质量分 94
主要是关于机器学习的原理分析,介绍,以及编程实现
Liu_LongPo
这个作者很懒,什么都没留下…
展开
-
机器学习算法原理与实践(一)、基于感知哈希算法的图像搜索实现
基于感知哈希算法计算出图片的指纹,根据不同图片的指纹计算汉明距离进行图像搜索原创 2015-03-10 17:18:39 · 6873 阅读 · 2 评论 -
机器学习算法原理与实践(二)、meanshift算法图解以及在图像聚类、目标跟踪中的应用
图解meanshift算法,方便理解。公式推导,总结meanshift算法在图像聚类中的应用,总结meanshift算法在目标跟踪的原理和应用原创 2015-03-27 16:53:04 · 14317 阅读 · 11 评论 -
机器学习算法原理与实践(三)、卡尔曼滤波器算法浅析及matlab实战
卡尔曼滤波器是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。而且由于观测包含系统的噪声和干扰的影响,所以最优估计也可看做是滤波过程。卡尔曼滤波器的核心内容就是5条公式,计算简单快速,适合用于少量数据的预测和估计。下面我们用一个例子来说明一下卡尔曼算法的应用。假设我们想在有一辆小车,在 t 时刻其速度为 Vt ,位置坐标为 Pt,ut 表示 t 时刻的加速度,那么我原创 2015-04-29 18:22:25 · 25338 阅读 · 15 评论 -
机器学习算法原理与实践(五)、GMM与K-means的那些事
【原创】Liu_LongPo 转载请注明出处【优快云】http://blog.youkuaiyun.com/llp1992GMM算法GMM ,Gaussian Mixture Model,顾名思义,就是说该算法由 多个高斯模型线性叠加 混合而成。每个高斯模型我们称之为 component 。GMM算法描述的是数据的本身存在的一种分布,如果component足够多的话,GMM可以逼近任意一种概率密度分布,但是此原创 2015-07-25 17:05:01 · 22893 阅读 · 11 评论 -
机器学习算法原理与实践(四)、AdaBoost算法详解与实战
【原创】Liu_LongPo 转载请注明出处 【优快云】http://blog.youkuaiyun.com/llp1992AdaBoost算法是基于单层决策树等弱分类算法的强学习分类算法。单层决策树算法也是一种分类算法,但是其分类效果较差,只根据一个特征进行数据划分,因此单层决策树算法被称为弱分类算法;而AdaBoost算法通过将多个弱分类算法串行训练而成,属于强分类算法。AdaBoost算法是boost原创 2015-06-16 09:25:39 · 7440 阅读 · 5 评论 -
机器学习实战ByMatlab(五)Logistic Regression
什么叫做回归呢?举个例子,我们现在有一些数据点,然后我们打算用一条直线来对这些点进行拟合(该曲线称为最佳拟合曲线),这个拟合过程就被称为回归。利用Logistic回归进行分类的主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类。这里的”回归“一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的嘴阀就是寻找最佳拟合曲线,使用的是最优化算法。基于Logistic回归和Sigmo原创 2015-04-18 16:40:44 · 15282 阅读 · 37 评论 -
机器学习实战ByMatlab(四)二分K-means算法
前面我们在是实现K-means算法的时候,提到了它本身存在的缺陷: 1.可能收敛到局部最小值 2.在大规模数据集上收敛较慢对于上一篇博文最后说的,当陷入局部最小值的时候,处理方法就是多运行几次K-means算法,然后选择畸变函数J较小的作为最佳聚类结果。这样的说法显然不能让我们接受,我们追求的应该是一次就能给出接近最优的聚类结果。其实K-means的缺点的根本原因就是:对K个质心的初始选原创 2015-04-17 13:44:00 · 11550 阅读 · 25 评论 -
机器学习实战ByMatlab(三)K-means算法
K-means算法属于无监督学习聚类算法,其计算步骤还是挺简单的,思想也挺容易理解,而且还可以在思想中体会到EM算法的思想。K-means 算法的优缺点: 1.优点:容易实现 2.缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据以往的回归算法、朴素贝叶斯、SVM等都是有类别标签y的,因此属于有监督学习,而K-means聚类算法只有x,没有y在聚类问题中,我们的原创 2015-04-17 13:31:53 · 9487 阅读 · 5 评论 -
机器学习实战ByMatlab(二)PCA算法
PCA 算法也叫主成分分析(principal components analysis),主要是用于数据降维的。为什么要进行数据降维?因为实际情况中我们的训练数据会存在特征过多或者是特征累赘的问题,比如:一个关于汽车的样本数据,一个特征是”km/h的最大速度特征“,另一个是”英里每小时“的最大速度特征,很显然这两个特征具有很强的相关性拿到一个样本,特征非常多,样本缺很少,这样的数据用回归去你和将原创 2015-04-15 21:58:35 · 7361 阅读 · 0 评论 -
机器学习实战ByMatlab(一)KNN算法
介绍机器学习算法KNN,并提供matlab,python实例,提供手写识别系统matlab完整代码原创 2015-04-14 13:16:47 · 44177 阅读 · 35 评论