自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 PCA主成分分析

在这种情况下,可以使用PCA对这些向量进行降维,将每张图像表示为一个包含较少元素的向量,从而使得计算和存储成本大大降低。同时,PCA还能够从这些低维向量中提取出最具代表性的信息,以便于后续s的人脸识别任务。主成分分析(PCA)是一种常用的数据降维方法,可以将高维数据转换为低维空间,同时保留原始数据中最具代表性的信息。中,如果要识别人脸,需要将每张图像表示为一个向量,每个元素代表图像中某个像素点的灰度值。其中协方差描述两个数据的相关性,接近1为正相关,接近-1为负相关,接近0为不相关。

2024-01-01 15:15:46 992

原创 机器学习-支持向量机

可用于线性/非线性分类,也可以用于回归,泛化错误率低,也就是说具有良好的学习能力,且学到的结果具有很好的推广性。可以解决小样本情况下的机器学习问题,可以解决高维问题,可以避免神经网络结构选择和局部极小点问题。SVM是最好的现成的分类器,现成是指不加修改可直接使用。并且能够得到较低的错误率,SVM可以对训练集之外的数据点做很好的分类决策。对参数调节和和函数的选择敏感。适用的数据类型:数值型和标称型数据。

2023-12-18 20:31:47 631 1

原创 逻辑斯蒂回归

1.收集数据:采用任意方法收集数据。2.准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。3.分析数据:采用任意方法对数据进行分析。4.训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。5.测试算法:一旦训练步骤完成,分类将会很快。6.使用算法:首先,我们需要输入一些数据,并将其转换成对应的结构化数值;接着,基于训练好的回归系数,就可以对这些数值进行简单的回归计算,判定它们属于哪个类别;

2023-12-04 13:56:57 1657

原创 朴素贝叶斯分类

朴素贝叶斯是一种简单但极为强大的预测建模算法 ,之所以称为朴素贝叶斯,是因为它假设每个输入变量是独立的。这是一个强硬的假设,实际情况并不一定,但是这项技术对于绝大部分的复杂问题仍然非常有效。朴素贝叶斯分类是一种有监督的分类算法,可以进行二分类,或者多分类。朴素贝叶斯模型由两种类型的概率组成:①每个类别的概率P(Cj);②每个属性的条件概率P(Ai|Cj)。

2023-11-13 17:33:09 169

原创 机器学习-决策树

分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。结点有两种类型:内部结点(internal node)和叶结点(leaf node)。内部结点表示一个特征或属性,叶结点表示一个类。⚪:内部结点正方形:叶结点。

2023-11-06 20:37:18 113 1

原创 第二章-模型评估

机器学习的目的是使学得的模型能很好的适用于“新样本”,即 使得模型具有泛化能力。但太好的模型可能因为学习器学习能力过于强大,进而把训练样本本身的特有性质当做所有潜在样本都会具有的一般性质,进而导致泛化能力减小,出现“过拟合”的情况。“欠拟合”是由于学习器没有通过训练样本学习到一般性质。P问题:在多项式时间内可解的问题;有效的学习算法必须是p问题,即在多项式时间内可以运行完成。np难问题:不知道这个问题是不是存在多项式时间内的算法。

2023-10-23 18:00:14 122

原创 第二章-K近邻算法

knn的基本思想:需要确定一个样本A的类别,可以计算出它与所有训练样本的距离,然后找出和该样本距离最小的k个样本,对这k个样本的类别进行统计,样本数最多的那个类别就是我们A的类别了。简单的说,K-近邻算法采用测量不同特征值之间的距离方法进行分类。· Iris (/ˈaɪrɪs/) 数据集是机器学习任务中常用的分类实验数据集,由Fisher在1936年整理。· Iris :Anderson’s Iris data set, 中文名称:安德森鸢尾花数据集。

2023-10-09 21:29:28 120 1

原创 机器学习课程笔记(一)2023.9.12

第一节理论课蔡老师着重讲了发展史且实验课罗阳老师讲了安装和使用vscode和anaconda,还没有进行实际的模型操作。故本人对机器学习做个简单下定义,然后记录一下我刚开始下载软件的过程。机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,在进行特定编程的情况下,给予计算机学习能力的领域。并将现有内容进行知识结构划分来有效提高学习效率。机器学习有下面几种定义:(1)机器学习是一门人工智能的科学,该领域的主要研究对象是,特别是如何在经验学习中改善具体算法的性能。

2023-09-25 19:30:41 88 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除