
机器学习算法
文章平均质量分 80
稚枭天卓
manu
展开
-
Matlab聚类分析(Cluster Analyses)
Matlab提供系列函数用于聚类分析,归纳起来具体方法有如下: 方法一:直接聚类,利用clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法,该方法的使用者无需了解聚类的原理和过程,但是聚类效果受限制。 方法二:层次聚类,该方法较为灵活,需要进行细节了解聚类原理,具体需要进行如下过程处理:(1)找到数据集合中变量两原创 2015-08-25 22:51:37 · 9940 阅读 · 3 评论 -
机器学习 之 KNN 算法 小结分析
原本想自己撰写一篇,关于 KNN 算法 文章, 但是 在 看完 JULY 的 介绍之后 ,心悦诚服 。 将算法表达得如此清楚。在 研究生学习期间 曾与 JULY 有过一面之缘 。现在 文章 节选如下 ,并附上自己对于部分 算法细节的 改进思路 、分析理解 。原创 2015-04-08 21:46:35 · 993 阅读 · 0 评论 -
机器学习 之 生成式模型 VS 判别式模型
【摘要】判别式模型,就是只有一个模型,你把测试用例往里面一丢,label就出来了,如SVM。生成式模型,有多个模型(一般有多少类就有多少个),你得把测试用例分别丢到各个模型里面,最后比较其结果,选择最优的作为label,如朴素贝叶斯。本文将从生成式模型与判别式模型的概念,适用环境以及具体模型三个方面分析比较这两个模型,并在最后对列出模型范例,进行范例比较。【基本概念】生成模型,原创 2015-07-31 13:46:30 · 15113 阅读 · 3 评论 -
机器学习 之 形变部件模型 浅析
基于形变部件模型(Deformable Part Models)的目标检测 基于cascade的目标检测,cascade的级联思想可以快速抛弃没有目标的平滑窗(sliding window),因而大大提高了检测效率,但也不是没缺点,缺点就是它仅仅使用了很弱的特征,用它做分类的检测器也是弱分类器,仅仅比随机猜的要好一些,它的精度靠的是多个弱分类器来实行一票否原创 2015-11-26 21:30:28 · 3051 阅读 · 0 评论 -
机器学习 之 牛顿法和梯度下降法原理与实现
泰勒定理f(x)在x0点可展开为幂级数f(x)=∑∞i=0aif(x−x0)i,则f(x)在x0的N(x0,σ)邻域内有任意阶导数,且系数an=f(n)(x0)n!。因此f(x)=∑i=0∞aif(x−x0)i=∑i=0∞f(i)(x0)i!f(x−x0)i称为f(x)在x0的泰勒级数,系数称为泰勒系数。当x0=0时,称为麦克劳林级数。牛顿法求根原创 2015-09-23 22:35:21 · 2425 阅读 · 0 评论 -
机器学习 SURF 描述子详述
1. 构造高斯金字塔尺度空间 其实surf构造的金字塔图像与sift有很大不同,就是因为这些不同才加快了其检测的速度。Sift采用的是DOG图像,而surf采用的是Hessian矩阵行列式近似值图像。首先来看看图像中某个像素点的Hessian矩阵,如下: 即每一个像素点都可以求出一个Hessian矩阵。但是由于我们的特征点需要具备尺度原创 2015-11-05 17:10:46 · 2274 阅读 · 0 评论 -
机器学习 之 OCCSVM 模型
介绍一下one class classification以及用SVDD(support vector domain description)做one class classification。one class classification 和多类 classification 的思路还是有很大差别。 classification问题一般都是 2 类及 2 类以上的,典型的原创 2015-09-10 15:00:43 · 4402 阅读 · 2 评论 -
机器学习 之 SVM 为什么使用核函数
用一个具体文本分类的例子来看看这种向高维空间映射从而分类的方法如何运作,想象一下,我们文本分类问题的原始空间是1000维的(即每个要被分类的文档被表示为一个1000维的向量),在这个维度上问题是线性不可分的。现在我们有一个2000维空间里的线性函数f(x’)=+b注意向量的右上角有个’哦。它能够将原问题变得可分。式中的w’和x’都是2000维的向量,只不过w’是定值,而x’是变量(好吧,严原创 2015-08-30 21:18:41 · 1569 阅读 · 0 评论 -
机器学习 径向基(Radial basis function)与RBF核函数 浅析
径向基函数(RBF)在神经网络领域扮演着重要的角色,如 RBF神经网络具有唯一最佳逼近的特性,径向基作为核函数在SVM中能将输入样本映射到高维特征空间,解决一些原本线性不可分的问题。 本文主要讨论: 1. 先讨论核函数是如何把数据映射到高维空间的,然后引入径向基函数作核函数,并特别说明高斯径向基函数的几何意义,以及它作为核函数时为什么能把数据映射到无限维空间。 2.提到了径向基函数,就继续讨论下径向基函数神经网络为什么能用来逼近。原创 2015-09-01 20:14:16 · 21697 阅读 · 1 评论 -
机器学习 之 libsvm 参数说明
因为要用svm做regression,所以看了一些关于libsvm,总结以备用libsvm在训练model的时候,有如下参数要设置,当然有默认的参数,但是在具体应用方面效果会大大折扣。Options:可用的选项即表示的涵义如下 -s svm类型:SVM设置类型(默认0) 0 -- C-SVC 1 --v-SVC 2 – 一类SVM 3 -- e -SV原创 2015-08-06 20:46:13 · 2508 阅读 · 0 评论 -
机器学习 之 SVM VC维度、样本数目与经验风险最小化的关系
VC维在有限的训练样本情况下,当样本数 n 固定时,此时学习机器的 VC 维越高学习机器的复杂性越高。VC 维反映了函数集的学习能力,VC 维越大则学习机器越复杂(容量越大)。 所谓的结构风险最小化就是在保证分类精度(经验风险)的同时,降低学习机器的 VC 维,可以使学习机器在整个样本集上的期望风险得到控制。 经验风险和实际风险之间的关系,注意引入这个原因是原创 2015-08-06 10:38:42 · 4490 阅读 · 1 评论 -
哈希表 之 接入与身份认证技术概述
1 概述随着信息化的快速发展,对国家、组织、公司或个人来说至关重要的信息越来越多的通过网络来进行存储、传输和处理,为获取这些关键信息的各种网络犯罪也相应急剧上升。当前,网络安全在某种意义上已经成为一个事关国家安全,社会经济稳定的重大问题,得到越来越多的重视。在网络安全中,身份认证技术作为第一道,甚至是最重要的一道防线,有着重要地位,可靠的身份认证技术可以确保信息只被正确的“人”所访问。身份原创 2015-08-18 11:14:07 · 2369 阅读 · 0 评论 -
机器学习 libsvm交叉验证与网格搜索(参数选择)
首先说交叉验证。交叉验证(Cross validation)是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力(generalize), 能够避免过拟合问题。交叉验证一般要尽量满足:1)训练集的比例要足够多,一般大于一半2)训练集和测试集要均匀抽样交叉验证主要分成以下几类:1)Double cross-validationDouble cross原创 2015-08-27 22:14:47 · 3575 阅读 · 1 评论 -
A* 算法详解
我们尝试解决的问题是把一个游戏对象(game object)从出发点移动到目的地。路径搜索(Pathfinding)的目标是找到一条好的路径——避免障碍物、敌人,并把代价(燃料,时间,距离,装备,金钱等)最小化。运动(Movement)的目标是找到一条路径并且沿着它行进。把关注的焦点仅集中于其中的一种方法是可能的。一种极端情况是,当游戏对象开始移动时,一个老练的路径搜索器(pathfinder)外转载 2016-12-31 10:37:38 · 10966 阅读 · 0 评论