
机器学习
悟道修炼中
百度资深工程师,擅长图像、文本检索
展开
-
opencv2.4.9中KNN算法理解
KNN算法opencv中文版原文描述是:K近邻可能是最简单的分类器。训练数据跟类别标签放在一起,离测试数据最近的(欧式距离最近)K个样本进行投票,确定测试数据的分类结果。这可能是你想到的最贱的方法,该方法比较有效,但是速度比较慢且对内存的需求比较大(因为它需要存储所有训练集)。离测试数据是否最近要求计算测试样本与所有点的距离,可以把这个过程看成搜索过程,是个求top-K的问题。由于要进行投原创 2015-11-26 20:07:40 · 2748 阅读 · 0 评论 -
opencv2.4.9中ann_mlp.cpp学习
多层感知机的结构http://www.ieee.cz/knihovna/Zhang/Zhang100-ch03.pdf” title=”” /> 理论上已经证明,单层感知机无法拟合XOR等非线性函数,而两层感知机(hidden layer,output layer,但不包括input layer)可以拟合任意连续函数。该理论很好,但是对应一个待拟合的函数,却无法给出每层到底需要多少个神经元(neu原创 2015-11-22 17:09:23 · 4081 阅读 · 0 评论 -
opencv2.4.9中贝叶斯分类器理解(一)
简介设训练数据集由独立同分布产生。朴素贝叶斯法通过训练数据集学习联合概率密度函数。具体地学习学习先验概率分布和条件概率分布,于是根据贝叶斯公式就可以得到联合概率密度函数了。从上面的描述中知道贝叶斯分类器要计算条件概率和先验概率来估计联合概率分布,属于产生式模型(Generative models )。产生式模型可以根据联合分布生成条件分布,比如,可以让机器生成不同场景、物体并让物体交互(感觉用到游戏原创 2015-11-28 12:25:07 · 3780 阅读 · 0 评论 -
opencv2.4.9中随机森林学习
Introductionforest作为计算机领域术语是器学习先驱者,分类回归树作者之一,Bagging方法发明者Leo Breiman提出的,Random forest algorithm是由Leo Breiman and Adele Cutler 2001年提出的,用来做分类、回归或其他任务,但是Random forest这个词1963年在The distance method for esti原创 2015-11-23 11:59:53 · 2646 阅读 · 0 评论 -
opencv2.4.9中K-means算法理解
K-means算法opencv中文版原文描述是:K均值是一种非监督的聚类方法,使用K个均值来表示数据的分布,其中K由用户定义。该方法跟期望最大化方法的区别是K均值的中心不是高斯分布,而且因为各个中心竞争去“俘获”最近的点,所以聚类更像肥皂泡。该方法由Steinhaus发明,并由Lloyd推广使用。K均值有以下3个问题. 1.它不能保证找到定位聚类中心的最佳方案,但是它能保证能收敛到某个解决方案原创 2015-11-26 14:59:47 · 2636 阅读 · 4 评论 -
opencv2.4.9中期望最大(EM)算法理解
简介 首先,明确问题。假如,我需要了解成都这个城市所有人口的身高情况,如果我是万能的上帝(其实不信上帝),只要告诉我某个人的生成八字我就可以知道ta的身高,但可惜我不是,如果还是想知道这个城市中任何人的身高,就只有采用统计推断的办法了,假设我知道整个城市所有人的身高分布(总体分布)情况,给定一个人的其他情况,我就能大概推断出ta的身高了,如何才能知道总体分布,不可能将所有人的分布都统计下原创 2015-11-24 11:32:02 · 2901 阅读 · 0 评论 -
理解赤池信息量(AIC),贝叶斯信息量(BIC)
一、基本概念AIC: Akaike information criterion,赤池信息量。 BIC:Bayesian information criterion,贝叶斯信息度量。在选择模型来预测推理时时默认了一个假设,即给定数据下存在一个最佳的模型,且该模型可以通过已有数据估计出来,根据某个选择标准选择出来的模型,用它所做的推理应该是最合理的。这个选择标准就可以是AIC和BIC。没有模原创 2016-06-26 21:41:38 · 68665 阅读 · 13 评论 -
SMOTE插值代码阅读
类别不均衡学习的基本策略包括:1)对分类器的预测值缩放,改变阈值;2)对数据集里的反例进行欠采样;3)对正例进行过采样;欠采样由于丢弃了大量反例,减少了训练集大小,训练时间开销相比过采样要大;过采样法不能简单地对初始正例进行重复采样,这会导致过拟合;正确过采样的方法是对正例进行插值。SMOTE的主要步骤根据 机器学习 —— 类不平衡问题与SMOTE过采样算法 的介绍如下所示:SM...原创 2019-01-20 20:30:57 · 1098 阅读 · 0 评论