- 博客(35)
- 收藏
- 关注

原创 记录跑强化学习(DRL)的过程中踩过的坑
笔者之前从未接触过机器学习的相关领域,相当于学习DRL是从零开始。开一篇markdown只是记录一下踩过的坑,或者说是总结一下跑项目的经验,以便以后给他人以帮助或者给自己做个小笔记。遇到问题会更新在上面。
2024-09-10 13:53:59
460
原创 Python计算机视觉 第10章-OpenCV
OpenCV 是一个C++ 库,用于(实时)处理计算视觉问题。实时处理计算机视觉的 C++ 库,最初由英特尔公司开发,现由 Willow Garage 维护。OpenCV 是在 BSD 许可下发布的开源库,这意味着它对于学术研究和商业应用是免费的。
2024-09-15 14:05:28
2348
1
原创 Python计算机视觉 第9章-图像分割
变分法是一种强大的数学工具,通过优化函数在函数空间中找到最优解,广泛应用于各种领域。Chan-Vese 模型是一种典型的变分模型,用于图像分割,特别适用于处理不均匀亮度的图像。通过最小化目标函数,Chan-Vese 模型能够有效地将图像分割成前景和背景区域,广泛应用于医学图像和视频分析等领域。
2024-09-15 13:45:34
2626
1
原创 Python计算机视觉 第8章-图像内容分类
在分类方法中,最简单且用得最多的一种方法之一就是 KNN(K-Nearest Neighbor ,K邻近分类法),这种算法把要分类的对象(例如一个特征向量)与训练集中已知类标记的所有对象进行对比,并由 k 近邻对指派到哪个类进行投票。这种方法通常分类效果较好,但是也有很多弊端:与 K-means 聚类算法一样,需要预先设定 k 值,k 值的选择会影响分类的性能;此外,这种方法要求将整个训练集存储起来,如果训练集非常大,搜索起来就非常慢。
2024-09-10 11:08:12
1203
原创 Python计算机视觉 第7章-图像搜索
在大型图像数据库上,CBIR(Content-Based Image Retrieval,基于内容的图像检索)技术用于检索在视觉上具相似性的图像。这样返回的图像可以是颜色相似、纹理相似、图像中的物体或场景相似;总之,基本上可以是这些图像自身共有的任何信息。对于高层查询,比如寻找相似的物体,将查询图像与数据库中所有的图像进行完全比较(比如用特征匹配)往往是不可行的。在数据库很大的情况下,这样的查询方式会耗费过多时间。
2024-09-10 09:46:19
774
原创 Python计算机视觉 第5章-多视图几何
在计算机视觉的多视图几何中,外极几何(Epipolar Geometry)描述了两个相机视角之间的几何关系,常用于立体匹配、图像配准和3D重建。
2024-08-30 14:14:49
1052
原创 Python计算机视觉 第4章-照相机模型与增强现实
针孔照相机模型(有时称为射影照相机模型)是计算机视觉中广泛使用的照相机模型。对于大多数应用来说,针孔照相机模型简单,并且具有足够的精确度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在针孔照相机模型中,在光线投影到图像平面之前,从唯一一个点经过,也就是照相机中心C。图4-1为从照相机中心前画出图像平面的图解。事实上,在真实的照相机中,图像平面位于照相机中心之后,但是照相机的模型和图4-1的模型是一样的。
2024-08-28 21:57:15
1138
原创 Python计算机视觉 第3章-图像到图像的映射
单应性变换(Homography)是计算机视觉中非常重要的一种几何变换,它用于将一个平面内的点映射到另一个平面内。具体来说,单应性变换可以描述一个图像在摄像机视角变化、平面移动或旋转时,如何从一个视角变换到另一个视角。单应性变换的频繁使用,尤其是在涉及多个视角或需要精确对齐图像的情况下,能够显著提升算法的鲁棒性和精度。在项目中,理解和正确应用单应性变换是处理图像和三维几何信息的关键技能。x′y′w′H⋅xyw其中,单应性矩阵HHh11h。
2024-08-24 23:10:46
946
原创 Python计算机视觉 第2章-局部图像描述子
Harris角点检测算法(也称Harris & Stephens角点检测器)是一个极为简单的角点检测算法。该算法的主要思想是,如果像素周围显示存在多于一个方向的边,我们认为该点为兴趣点。该点就称为角点。
2024-08-23 20:29:15
1075
1
原创 Python计算机视觉 第1章-基本的图像操作和处理
本章讲解操作和处理图像的基础知识,将通过大量示例介绍处理图像所需的Python工具包,并介绍用于读取图像、图像转换和缩放、计算导数、画图和保存结果等的基本工具。
2024-08-20 02:37:07
943
原创 机器学习 第14章-概率图模型
机器学习最重要的任务,是根据一些已观察到的证据(例如训练样本)来对感兴趣的未知变量(例如类别标记)进行估计和推测。概率模型(probabilisticmodel)提供了一种描述框架,将学习任务归结于计算变量的概率分布。在概率模型中,利用已知变量推测未知变量的分布称为“推断”(inference),其核心是如何基于可观测变量推测出未知变量的条件分布。具体来说,假定所关心的变量集合为Y,可观测变量集合为O,其他变量的集合为“生成式”(generative)模型考虑联合分布PYRO。
2024-08-18 01:48:07
811
原创 机器学习 第12章-计算学习理论
顾名思义,计算学习理论(computational learning theory)研究的是关于通过“计算”来进行“学习”的理论,即关于机器学习的理论基础,其目的是分析学习任务的困难本质,为学习算法提供理论保证,并根据分析结果指导算法设计。给定样例集D。假设X中的所有样本服从一个隐含未知的分布DD中所有样本都是独立地从这个分布上采样而得,即独立同分布(independent and identically distributed)样本令h为从X到Y的一个映射,其泛化误差为Eh;DP。
2024-08-17 01:13:32
400
原创 机器学习 第11章-特征选择与稀疏学习
我们将属性称为“特征”(feature),对当前学习任务有用的属性称为“相关特征”(relevant feature)、没什么用的属性称为“无关特征”(irrelevant feature).从给定的特征集合中选择出相关特征子集的过程,称为“特征选择”(feature selection).特征选择是一个重要的“数据预处理”(data preprocessing)过程,在现实机器学习任务中,获得数据之后通常先进行特征选择,此后再训练学习器.
2024-08-16 19:37:01
908
原创 机器学习 第10章-降维与度量学习
k近邻(k-Nearest Neighbor,简称kNN)学习是一种常用的监督学习方法其工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这k个样本的实值输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。
2024-08-05 01:13:24
1380
1
原创 机器学习 第9章-聚类
在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是“聚类”(clustering)。聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(cluster)。通过这样的划分,每个簇可能对应于一些潜在的概念(类别),如“浅色瓜”“深色瓜”,“有籽瓜”“无籽瓜”,甚至“本地瓜”“外地瓜”等;
2024-08-04 13:06:27
1374
1
原创 机器学习 第5章-神经网络
神经网络(neural networks)方面的研究很早就已出现,今天“神经网络已是一个相当大的、多学科交叉的学科领域。各相关学科对神经网络的定义多种多样,本书采用目前使用得最广泛的一种,即“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应”。我们在机器学习中谈论神经网络时指的是“神经网络学习”,或者说,是机器学习与神经网络这两个学科领域的交叉部分。
2024-08-03 01:12:33
902
原创 机器学习 第8章-集成学习
集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifersystem)、基于委员会的学习(committee-based learning)等。图8.1显示出集成学习的一般结构:先产生一组“个体学习器”(individual learner),再用某种策略将它们结合起来。
2024-08-01 21:19:30
548
原创 机器学习 第7章-贝叶斯分类器
贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。下面我们以多分类任务为例来解释其基本原理。假设有N种可能的类别标记,即Yc1c2...cNλij是将一个真实标记为cj的样本误分类为ci所产生的损失。基于后验概率Pci∣x可获得将样本x分类为ci。
2024-07-27 23:50:23
372
原创 机器学习 第6章-支持向量机
给定训练样本集D{(x1y1x2y2...xmym)}yi∈−11分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。但能将训练样本分开的划分超平面可能有很多,如图6.1所示,我们应该努力去找到哪一个呢?所以我们的想法应该是去找位于两类训练样本“正中间”的划分超平面,即图6.1中最粗的那条线。因为该划分超平面对训练样本局部扰动的“容忍”性最好。wTxb0其中ww1;
2024-07-27 02:58:43
885
原创 机器学习 第4章-决策树
决策树(decision tree)是一类常见的机器学习方法。以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新示例进行分类,这个把样本分类的任务,可看作对“当前样本属于正类吗?”这个问题的“决策”或“判定”过程。顾名思义,决策树是基于树结构来进行决策的,这恰是人类在面临决策问题时一种很自然的处理机制。显然,决策过程的最终结论对应了我们所希望的判定结果。一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应于一个属性测试;
2024-07-25 20:08:51
960
原创 机器学习 第3章-线性模型
给定由d个属性描述的示例xx1;x2;...;xd,其中xi是x在第i个属性上的取值,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即fxw1x1w2x2⋅⋅⋅wdxdb一般用向量形式写成fxwTxb其中ww1;w2;...;wdw和b学得之后,模型就得以确定了。
2024-07-20 00:18:35
640
原创 机器学习 第2章-模型评估与选择
通常我们把分类错误的样本数占样本总数的比例称为“错误率”(errorrate),即如果在m个样本中有a个样本分类错误,则错误率Eam;相应的1−am称为“精度”(accuracy),即“精度= 1-错误率”.常写为百分比形式1−ma×100更一般地,我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”(error),学习器在训练集上的误差称为“训练误差”(trainingerror)或“经验误差”(empirical error)。
2024-07-18 23:48:25
926
原创 机器学习 第1章-绪论
机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验"通常以"数据"形式存在,因此机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型” (model) 的算法,即"学习算法"。有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西瓜),模型会给我们提供相应的判断。如果说计算机科学是研究关于"算法"的学问,那么类似的,可以说机器学习是研究关于"学习算法"的学问。
2024-07-17 15:29:44
856
原创 数字图像处理 第12章-目标识别
数字图像处理 第12章-目标识别本章中介绍的模式识别方法主要分为两大领域:决策理论方法和结构方法。第一类方法处理的是使用定量描绘子来描述的各种模式,如长度、面积和纹理等。第二类方法处理的是由定性描绘子来描述的各种模式。12.1 模式和模式类模式是描绘子的组合。在有关模式识别文献中经常使用特征来表示描绘子。模式类是指具有某些共同属性的一族模式。模式类用ω1,ω2,…ωWω_1,ω_2,…ω_Wω1,ω2,…ωW表示,其中WWW是模式类数。由机器完成的模式识别是对不同的模式赋予不同类别的技术
2024-07-13 02:57:42
599
原创 数字图像处理 第11章-表示和描述
我们假设:(1)处理的是二值图像,其目标和背景点分别标为1和0(2)图像已使用值为0的边界填充,因而消除了目标与图像边界合并的可能性。为方便起见,我们仅限于讨论单个区域。通过单独地处理各个区域,该方法可扩展到多个不相交的区域。给定一个二值区域R或其边界,追踪R的边界或给定边界的算法由如下步骤组成:1、令起始点b0为图像中左上角标记为1的点。使用c0表示b0西侧的邻点[见图11.1(b)]。很明显,c0总是背景点。从c0开始按顺时针方向考察b0。
2024-07-11 02:28:05
475
原创 数字图像处理 第10章-图像分割
分割将图像细分为构成它的子区域或物体。细分的程度取决于要解决的问题。也就是说,在应用中,当感兴趣的物体或区域已经被检测出来时,就停止分割。异常图像的分割是图像处理中最困难的任务之一。分割的精度决定着计算分析过程最终的成败。因此,应该对改进准确分割的可能性给予相当的关注。本章中的多数分割算法均基于灰度值的两个基本性质之一:不连续性和相似性。在第一类中,方法是以灰度突变为基础分割一幅图像,比如图像的边缘。在第二类中,主要方法是根据一组预定义的准则将一幅图像分割为相似的区域。
2024-07-10 05:12:02
936
原创 数字图像处理 第9章-形态学图像处理
形态学(morphology)一词通常表示生物学的一个分支,该分支主要研究动植物的形态和结构。这里,我们使用同一词语表示数学形态学的内容,将数学形态学作为工具从图像中提取表达和描绘区域形状的有用图像分量,如边界、骨架和凸壳等。
2024-07-07 01:45:07
932
原创 数字图像处理 第8章-图像压缩
术语数据压缩是指减少表示给定信息量所需数据量的处理。在该定义中,数据和信息是不相同的事情;数据是信息传递的手段。因为相同数量的信息可以用不同数量的数据表示,包含不相关或重复信息的表示称之为冗余数据。R1−1/C其中,C通常称为压缩率,定义为Cbb′在数字图像压缩的内容中,b通常是以二维灰度值阵列表示一幅图像所需的比特数。二维灰度阵列是人们观察和解释图像的首选格式,并且以它作为判定所有其他表示的标准。然而,当它变成紧凑的图像表示时,这些格式就远不是最佳格式了。
2024-07-04 03:07:06
667
原创 数字图像处理 第6章-彩色图像处理
在图像处理中,彩色的运用受两个主要因素的推动。第一,彩色是一个强有力的描绘子,它常常可简化从场景中提取和识别目标;第二,人可以辨别几千种彩色色调和亮度,但相比之下只能辨别几十种灰度色调。第二个因素在人工图像分析中特别重要。彩色图像处理可分为两个主要领域:全彩色处理和伪彩色处理。在第一类中,通常要求图像用全彩色传感器获取,如彩色电视摄像机或彩色扫描仪。在第二类中,问题是对一种特定的单色灰度或灰度范围赋予一种颜色。到目前为止,多数数字彩色图像处理是在伪彩色层面完成的。
2024-06-30 13:40:04
624
原创 数字图像处理 第5章-图像复原与重建
正像图像增强那样,图像复原技术的主要目的是以预先确定的目标来改善图像。尽管两者有相覆盖的领域,但图像增强主要是一个主观过程,而图像复原则大部分是一个客观过程。图像复原试图利用退化现象的某种先验知识来复原被退化的图像。因而,复原技术是面向退化模型的,并且采用相反的过程进行处理,以便恢复出原图像。相比之下,图像增强技术基本上是一个探索性过程,即根据人类视觉系统的生理特点来设计一种改善图像的方法。例如。
2024-06-28 12:48:20
900
原创 数字图像处理 第3章-灰度变换与空间滤波
术语空间域指图像平面本身,这类图像处理方法直接以图像中的像素操作为基础。这是相对于变换域中的图像处理而言的,变换域的图像处理首先把一幅图像变换到变换域,在变换域中进行处理,然后通过反变换把处理结果返回到空间域。空间域处理主要分为灰度变换和空间滤波两类。空间滤波涉及改善性能的操作,如通过图像中每一个像素的邻域处理来锐化图像。本节讨论的所有图像处理技术都是在空间域进行的。与频率域相反,空间域技术直接在图像像素上操作,例如,对于频率域来说,其操作在图像的傅里叶变换上执行,而不针对图像本身。某些图像处理任务在空间域
2024-06-22 17:16:16
809
原创 数字图像处理 第2章-数字图像基础
对图像的操作是以像素为基础来执行的,所以一幅图像可以被等价的看成一个矩阵,矩阵相关的数学知识可以参考线性代数。
2024-06-21 15:04:33
2196
2
原创 数字图像处理 第1章-绪论
一幅图像我们可把它定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标。任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或者灰度。当x、y和灰度值f是有限的离散数值时,我们称该图像为数字图像。而数字图像处理则是借助数字计算机来处理上述的数字图像。从图像处理到计算机视觉的这个连续统一体内并没有明确的界限。在这个连续的统一体中考虑三种典型的计算处理,即低级、中级和高级处理。低级处理涉及初级操作,如降低噪声的图像预处理、对比度增强和图像尖锐化。
2024-06-19 15:45:03
607
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人