
模式识别与机器学习
文章平均质量分 81
大哲子
计算机与控制学院,整理笔记,有利于复习
展开
-
随机森林中,为什么oob样本的数量是三分之一
今天看了RF,发现里面有一个1/3的概率,到底怎么求出来的,我看了数,推了一下公式。模型评估方法在机器学习中,通常把样本分成训练集和测试集,在划分样本的过程中,存在着不同的抽样方法。有哪些抽样方法,他们有什么优缺点1.Holdout检验直接样原始样本37分,70%为训练集,30%为测试集。绘制ROC曲线,计算准确率,召回率。缺点:没有随机性。2. 交叉检验将全部样本划分成K个大小相...原创 2020-04-12 11:04:33 · 2071 阅读 · 0 评论 -
机器学习与模式识别第三章:判别函数
在很多实际问题中,由于样本特征空间的类条件概率密度的形式常常很难确定,利用非参数方法估计需要很大的样本空间,而且随着特征空间位数的增加所需的样本数急剧增加,因此在实际问题中,我们往往不确定某个判别函数类,然后利用样本集确定出判别函数中的未知参数。线性判别线性判别函数法是一种较为简单的判别函数,最简单的是线性函数,它的分界面是超平面,采用线性判别函数所产生的错误率或风险虽然可能比贝叶斯分类器来的...原创 2018-10-13 23:22:39 · 9435 阅读 · 2 评论 -
分段线性判别函数&&模式空间和权空间
线性判别函数在进行分类决策时是最简单有效的,但在实际应用中,常常会出现不能用线性判别函数直接进行分类的情况。采用广义线性判别函数的概念,可以通过增加维数来得到线性判别,但维数的大量增加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难,增加计算的复杂性。引入分段线性判别函数的判别过程,它比一般的线性判别函数的错误率小,但又比非线性判别函数简单。用判别函数分类可用一个二次判别...原创 2018-10-15 23:47:29 · 1926 阅读 · 0 评论 -
模式识别第4章—特征选择和提取
欢迎使用Markdown编辑器特征选择和提取是模式识别中的一个关键问题:前面讨论分类器设计的时候,一直假定已给出了特征向量维数确定的样本集,其中各样本的每一维都是该样本的一个特征;这些特征的选择是很重要的,它强烈地影响到分类器的设计及其性能;假若对不同的类别,这些特征的差别很大,则比较容易设计出具有较好性能的分类器。例如:判断一个人是否是软件工程师?肤色,体重,身高,工资,工资,编程...原创 2019-02-03 14:25:39 · 4160 阅读 · 0 评论 -
机器学习第一讲统计机器学习的理论
机器学习理论与统计机器学习的理论机器学习是一个无处不在的科学,现在人工智能非常火,其实人工智能的核心就是机器学习。这一讲主要讲解一下什么是机器学习,机器学习的历史,机器学习的新旧方法和一个简单的例子。机器学习方法的现在在计算机科学与技术方面的困难点主要在于对人脑的理解,知道大脑是如何工作的,他的推理,他的认知,他的创造。很多在计算机领域的研究都基于机器学习,我认为计算机领域的basic的研究...原创 2019-02-08 22:27:56 · 803 阅读 · 0 评论 -
机器学习第二讲-有监督学习
这一章讲三种方法:线性回归方法,判别式的分类方法,产生式的分类方法线性回归给出房子的面积,房子的位置,计算出房子的价钱。input是二维,面积跟位置输出目标是价格,我们可以用线性表达式做一个加权因此我们可以写成最简单的回归模型形式:解这个方程我们可以用梯度下降的方式求这是一个最简单的回归,我们可以从概率的角度对他进行解释:我们认为所有的结果都是我们的模型加上一个噪声造成的...原创 2019-02-10 01:34:12 · 245 阅读 · 0 评论