
模式识别
鹊踏枝-码农
专业码农20年-河畔青芜堤上柳,为问新愁,何事年年有?独立小桥风满袖,平林新月人归后。
展开
-
PCA的数学原理
出处:http://blog.youkuaiyun.com/xiaojidan2011/article/details/11595869from:http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关转载 2016-12-17 09:51:42 · 369 阅读 · 0 评论 -
模式识别之训练集、验证集和测试集
首先,需要说明一点的是,训练集(training set)、验证集(validation set)和测试集(test set)本质上并无区别,都是把一个数据集分成三个部分而已,都是(feature,label)造型。尤其是训练集与验证集,更无本质区别。测试集可能会有一些区别,比如在一些权威计算机视觉比赛中,测试集的标签是private的,也就是参赛者看不到测试集的标签,可以把预测的标签交给大赛组委原创 2017-10-26 21:46:04 · 8356 阅读 · 1 评论 -
模式识别分类器评价指标之DET曲线
DET(Detection Error Tradeoff )曲线是对二元分类系统误码率的曲线图,绘制出错误拒绝率FRR(False Reject Rate)与错误接受率(False Accept Rate)之间随着判断阈值的变化而变化的曲线图。现在DET曲线扩展到用于模式识别分类器性能的评价的一个指标之一。在上式中, 表示正样本总数, 表示正样本被拒绝即判定为负样本的数目, 表示负样本原创 2017-10-24 21:31:50 · 8108 阅读 · 1 评论 -
分类器模型评价指标之ROC曲线
Spark mllib 自带了许多机器学习算法,它能够用来进行模型的训练和预测。当使用这些算法来构建模型的时候,我们需要一些指标来评估这些模型的性能,这取决于应用和和其要求的性能。Spark mllib 也提供一套指标用来评估这些机器学习模型。具体的机器学习算法归入更广泛类型的机器学习应用,例如:分类,回归,聚类等等,每一种类型都很好的建立了性能评估指标。本节主要分享分类器模型评价指标。转载 2017-10-15 22:00:10 · 9203 阅读 · 0 评论 -
模式识别分类器评价指标之CMC曲线
CMC曲线全称是Cumulative Match Characteristic (CMC) curve,也就是累积匹配曲线,同ROC曲线Receiver Operating Characteristic (ROC) curve一样,是模式识别系统,如人脸,指纹,虹膜等的重要评价指标,尤其是在生物特征识别系统中,一般同ROC曲线一起给出,能够综合评价出算法的好坏。如下图所示:那么,CMC原创 2017-10-15 19:13:41 · 23447 阅读 · 12 评论 -
模式识别分类器评价指标之ROC曲线
ROC(Receiver Operating Characteristic Curve)接收器操作特性曲线,原先主要用于评价雷达中的漏报虚警等事件的指标,其中漏报表示雷达监控的空域中有敌机出现,而雷达没能检测出来;虚警则表示雷达监控的空域中没有敌机出现,而雷达却发出警报。后来ROC曲线又用在了医学分类指标中,主要是二分类,即有病/没病,后逐渐扩展到模式识别的多分类中,用来评价分类器的好坏。在R原创 2017-10-23 10:47:59 · 1714 阅读 · 0 评论 -
混淆矩阵的MATLAB实现
混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。在图像精度评价中,主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面。下面是混淆矩阵的Matlab实现示例,可直接复制粘贴运行:% function confusion_matrix(actual,detecte原创 2017-10-09 10:02:38 · 7261 阅读 · 0 评论 -
流形学习-Manifold Learning
来源:转载本文请联系原作者获取授权,同时请注明本文来自张重科学网博客。链接地址:http://blog.sciencenet.cn/blog-722391-583413.html 流形(manifold)的概念最早是在1854年由 Riemann 提出的(德文Mannigfaltigkeit),现代使用的流形定义则是由 Hermann Weyl 在1913年给出转载 2017-09-28 19:25:26 · 2714 阅读 · 0 评论 -
LibLinear(SVM包)使用说明之(一)README
来源: LibLinear(SVM包)使用说明之(一)README 本文主要是翻译liblinear-1.93版本的README文件。里面介绍了liblinear的详细使用方法。更多信息请参考: http://www.csie.ntu.edu.tw/~cjlin/liblinear/ 在这里我用到的是LibLinear的Ma转载 2017-09-16 09:06:10 · 605 阅读 · 0 评论 -
SURF原理总结
作者写的非常好。出处:http://www.cnblogs.com/ronny/p/4045979.html如果说SIFT算法中使用DOG对LOG进行了简化,提高了搜索特征点的速度,那么SURF算法则是对DoH的简化与近似。虽然SIFT算法已经被认为是最有效的,也是最常用的特征点提取的算法,但如果不借助于硬件的加速和专用图像处理器的配合,SIFT算法以现有的计算机仍然很难达到实时的程度。对转载 2017-01-07 11:16:55 · 7017 阅读 · 0 评论 -
混合高斯模型背景建模原理
该篇文章由某大学课件整理而得,涉及公式较多,输入不便,直接截图,请见谅!EM算法是一种迭代算法,用于含有隐含变量的概率模型参数的极大似然估计,或极大后验概率估计。EM算法的每次迭代由两步组成:E步,求期望(expection);M步,求极大(maximization)。算法引入算法距离: (三硬币模型)假设有3枚硬币,分别记作A,B,C。这些硬币正面出现的概率分别原创 2016-12-18 21:19:00 · 3058 阅读 · 0 评论 -
主成分分析PCA降维函数
在Matlab中有内置的built-in function PCA降维函数:[coeff,score,latent,tsquared,explained]=princomp(X),其中输出score即为经过PCA变换后的数据,但是默认取全部主成分,如X是100x20,其中100是样本数,20是特征维数,则PCA变换后的score仍然为100x20。若要降维为10维,可以直接取前10列即可,或者原创 2018-01-22 17:27:45 · 1120 阅读 · 0 评论