- 博客(32)
- 收藏
- 关注
原创 卷积神经网络 学习 笔记
卷积神经网络是深度学习在计算机视觉领域的突破性成果。在计算机视觉领域, 往往我们输入的图像都很大,使用全连接网络的话,计算的代价较高。另外图像也很难保留原有的特征,导致图像处理的准确率不高。 卷积神经网络(Convolutional Neural Network,CNN)是一种专门用于处理具有网格状结构数据的深度学习模型。最初,CNN主要应用于计算机视觉任务,但它的成功启发了在其他领域应用,如自然语言处理等。
2024-12-02 19:28:08
1000
原创 机器学习 线性回归 学习笔记
前面介绍了很多分类算法,分类的目标变量是,回归是对做出预测。(Nominal Data)是统计学和数据分析中的一种数据类型,它用于分类或标记不同的类别或组别,数据点之间并没有数值意义上的距离或顺序。例如,颜色(红、蓝、绿)、性别(男、女)或产品类别(A、B、C)。:标称数据的各个类别之间没有固有的顺序关系。例如,“性别”可以分为“男”和“女”,但“男”和“女”之间不存在大小、高低等顺序关系。:标称数据不能进行数学运算,因为它们没有数值含义。你不能对“颜色”或“品牌”这样的标称数据进行加减乘除。
2024-11-15 19:31:54
872
原创 机器学习 决策树
1、决策节点通过条件判断而进行分支选择的节点。如:将某个样本中的属性值(特征值)与决策节点上的值进行比较,从而判断它的流向。2、叶子节点没有子节点的节点,表示最终的决策结果。3、决策树的深度所有节点的最大层次数。决策树具有一定的层次结构,根节点的层次数定为0,从下面开始每一层子节点层次数增加决策树优点: 可视化 - 可解释能力-对算力要求低决策树缺点: 容易产生过拟合,所以不要把深度调整太大了。
2024-11-15 19:02:55
632
原创 机器学习 贝叶斯公式
我们先预估一个"先验概率",然后加入实验结果,看这个实验到底是增强还是削弱了"先验概率",由此得到更接近事实的"后验概率"。贝叶斯和朴素贝叶斯的概念是不同的,区别就在于“朴素”二字,朴素贝叶斯对条件概率分布做了。朴素贝叶斯分类器的关键假设是特征之间的条件独立性,即给定类别 a ,特征 和 (其中 相互独立。这样,朴素贝叶斯分类器就可以通过计算每种可能类别的条件概率和先验概率,然后选择具有最高概率的类别作为预测结果。P(X|a) 是给定类别 ( a ) 下观测到特征向量 的概率;
2024-11-14 20:01:24
629
原创 机器学习 笔记
缺点1:不适用于不平衡的数据集。可能发生的情况是,所有80%的 “0 “类数据都在训练集中,而所有 “1 “类数据都在测试集中。K-折交叉验证的变种, 分层的意思是说在每一折中都保持着原始数据中各个类别的比例关系,比如说:原始数据有3类,比例为1:2:1,采用3折分层交叉验证,那么划分的3折中,每一折中的数据类别保持着1:2:1的比例,这样的验证结果更加可信。在小数据集的情况下,有一部分数据将被保留下来用于测试模型,这些数据可能具有重要的特征,而我们的模型可能会因为没有在这些数据上进行训练而错过。
2024-11-14 19:51:13
383
原创 机器学习 笔记
data1=model.fit_transform(data) #使用API。max 分别是每种特征中的最小值和最大值,而 ��是当前特征值,# 导入jieba用于断词中文字符串。#sparse是否转换成三元组形式。data=[], #传入字典数据。scaled 是归一化后的特征值。
2024-11-12 20:32:42
499
原创 opencv 学习
欧几里得距离(Euclidean distance)是一种测量两个点之间直线距离的方式,常用于数学、物理学和计算机科学中的各种应用,包括机器学习中的数据点距离计算。如果距离大于阈值,则认为是不同的身份。和 OpenCV 是两个独立的计算机视觉库,但它们在功能上有一些重叠,并且经常一起使用来完成复杂的视觉任务。:在许多人脸识别系统中,如果计算出的距离小于某个设定的阈值,则系统会认为这两个面孔属于同一个人。在计算匹配的时候传入到函数的参数,已知人脸图片的人脸特征码 获取放入到列表中,未知获取下标未0。
2024-11-05 19:13:07
822
原创 opencv 学习笔记
为了减少图像中的噪声,可以采取一些专业的图像处理技术,如图像降噪(Image Denoising),通过减少数字图像中的噪声来提高图像的质量。较大时,空间上距离较远的像素也会被赋予较大的权重,这意味着滤波器会在更大的空间范围内进行平滑处理,导致图像的局部细节被进一步平滑。中值滤波适用于各种类型的图像,特别适合于那些受到椒盐噪声干扰的图像,例如传感器捕获的图像或者在传输过程中受到干扰的图像。高斯滤波是图像处理中常用的一种平滑滤波方法,其主要作用是去除图像中的噪声,并减少图像细节,以实现图像的平滑处理。
2024-11-04 19:30:35
492
原创 opencv 学习笔记
方便图像处理:在不同的颜色空间中,对应的通道代表了不同的属性,例如在RGB空间中,红、绿、蓝三个通道分别代表了颜色的强度,而在HSV空间中,H(色相)代表了颜色的种类,S(饱和度)代表了颜色的深浅,V(亮度)代表了颜色的明暗。这个函数主要用于图像的旋转变换。它可以将一个图像从一个颜色空间转换为另一个颜色空间,比如从RGB到灰度图像的转换,或者从BGR到HSV的转换等。将灰度图像转换为二值图像,根据指定的阈值将像素值分为两类:高于阈值的像素设为一个值(通常是255),低于阈值的像素设为另一个值(通常是0)。
2024-11-03 21:52:58
494
原创 OpenCV 学习笔记
是 OpenCV 提供的一个非常有用的函数,它允许用户定义一个回调函数,当鼠标事件发生时(如点击、释放、移动等),该回调函数会被调用。是 OpenCV 库中的一个函数,用于创建一个命名窗口,以便在该窗口中显示图像或进行其他图形操作。是 OpenCV 库中的一个函数,用于调整图像的大小。它返回一个布尔值和图像帧。: 直线的颜色,对于 BGR 图像,这应该是一个包含三个整数的元组,分别对应蓝色、绿色和红色的强度(例如。: 直线的另一个端点,也是一个包含两个元素(x, y)的元组,代表该点的坐标。
2024-10-31 19:19:37
1088
原创 Python 学习笔记
这些包提供了各种各样的功能,包括数据分析、机器学习、网络编程、Web开发、图形处理、自然语言处理等。可以包含任何Python代码,通常用于执行包的初始化操作,如变量初始化、导入模块、设定包的属性等。:数据必须以字符串的形式表示,键必须是双引号括起来的字符串,值可以是字符串、数字、布尔值、数组、对象或 null。.py 中定义的变量和函数可以在包的其他模块中共享,提供了一个包级别的命名空间,允许模块之间共享数据和功能。变量,可以明确指定哪些模块可以被从包中导入,从而限制包的公开接口,防止不需要的模块被导入。
2024-10-30 19:43:13
1003
原创 python 学习笔记
双端队列(Deque,Double-Ended Queue)是一种具有队列和栈性质的数据结构,它允许我们在两端进行元素的添加(push)和移除(pop)操作。当结合使用appendleft和popleft时,你实际上是在实现一个栈(Stack)的数据结构,因为栈是后进先出(LIFO)的,而这两个操作正好模拟了栈的“压栈”和“弹栈”行为。5.子结点(Child):若A结点是B结点的父结点,则称B结点是A结点的子结点;8.结点的层次(Level):规定根结点在1层,其它任一结点的层数是其父结点的层数加1。
2024-10-29 20:10:48
730
原创 python 学习笔记
Pandas 之所以能够实现了数据可视化,主要利用了 Matplotlib 库的 plot() 方法,它对 plot() 方法做了简单的封装,因此您可以直接调用该接口;数据结构是计算机科学中的一个核心概念,它是指数据的组织、管理和存储方式,以及数据元素之间的关系。入栈的操作,当有数据加入到栈时,判断数组长度是否达到阈值,是则抛栈已满的异常,否则将数据追加到数组的尾部;这一端被称为栈顶,相对地,把另一端称为栈底。从一个栈删除元素又称作出栈或退栈,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。
2024-10-28 18:59:26
808
原创 pandas 学习笔记
重置索引(reindex)可以更改原 DataFrame 的行标签或列标签,并使更改后的行、列标签与 DataFrame 中的数据逐一匹配。如果重置的索引标签在原 DataFrame 中不存在,那么该标签对应的元素值将全部填充为 NaN。reindex_like 方法用于将一个 DataFrame 或 Series 的索引重新排列,使其与另一个 DataFrame 或 Series 的索引相匹配。如果在重新索引的过程中,新的索引与原始索引不完全匹配,那么不匹配的位置将会被填充为 NaN 值。
2024-10-25 20:54:38
451
原创 pandas 学习笔记
DataFrame 一个表格型的数据结构,既有行标签(index),又有列标签(columns),它也被称异构数据表,所谓异构,指的是表格中每列的数据类型可以不同,比如可以是字符串、整型或者浮点型等。同 Series 一样,DataFrame 自带行标签索引,默认为“隐式索引”即从 0 开始依次递增,行标签与 DataFrame 中的数据项一一对应当然你也可以用“显式索引”的方式来设置行标签。描述:如果为 True,则忽略原 DataFrame 的索引,并生成新的整数索引,索引值默认从0开始。
2024-10-24 19:44:34
1053
原创 Matplotlib 学习 笔记
pylab 是 matplotlib 中的一个模块,它将 matplotlib.pyplot 和 numpy 的功能组合在一起,使得你可以直接使用 numpy 的函数和 matplotlib.pyplot 的绘图功能,而不需要显式地导入 numpy 和 matplotlib.pyplot。subplots 是 matplotlib.pyplot 模块中的一个函数,用于创建一个包含多个子图(subplots)的图形窗口。twinx 函数用于创建共享 X 轴的子图,twiny 函数用于创建共享 Y 轴的子图。
2024-10-23 19:20:43
962
原创 NumPy 学习笔记
无论数组的维度如何,ndarray.flat属性都会将数组视为一个扁平化的一维数组,按行优先的顺序遍历所有元素。在 NumPy 中,计算方差时使用的是统计学中的方差公式,而不是概率论中的方差公式,主要是因为 NumPy 的设计目标是处理实际数据集,而不是概率分布。如果数组的长度是偶数,则中位数是中间两个数的平均值。flatten() 返回的是原数组的一个拷贝,因此对返回的数组进行修改不会影响原数组。最后一行代码将数组形状修改为(3, 4),原数组的元素数量不够,则重复原数组的元素填充。
2024-10-22 20:16:46
737
原创 NumPy 学习笔记
这要求维数相同,且各维度的长度相同,如果不相同,可以通过广播机制,这种机制的核心是对形状较小的数组,在横向或纵向上进行一定次数的重复,使其与形状较大的数组拥有相同的维度。相比于基本索引,高级索引可以访问到数组中的任意元素,并且可以用来对数组进行复杂的操作和修改。如果使用shape属性修改数组的形状,则修改的是原数组的形状,reshape修改数组的形状会返回一个新数组,不修改原数组的形状。长度匹配:如果两个数组在某个维度上的长度不同,但其中一个数组在该维度上的长度为 1,则该数组会沿着该维度进行广播。
2024-10-21 19:07:16
941
原创 python 学习 笔记
yield 语句相比于 return 语句,差别就在于 yield 语句返回的是可迭代对象,而 return 返回的为不可迭代对象。yield 是一个关键字,用于定义生成器函数,生成器函数是一种特殊的函数,可以在迭代过程中逐步产生值,而不是一次性返回所有结果。跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。含有yield 语句的函数是生成器函数,此函数调用回返回一个生成器对象,生成器也是可迭代对象。根据条件筛选可迭代对象中的元素,返回值为新可迭代对象。
2024-10-20 17:16:39
318
原创 python 学习笔记
元组推导式和列表推导式的用法也完全相同,只是元组推导式是用 () 圆括号将各部分括起来,而列表推导式用的是中括号 [],另外元组推导式返回的结果是一个生成器对象。for out_exp in input_list:迭代 input_list 将 out_exp 传入到 out_exp_res 表达式中。元组推导式可以利用 range 区间、元组、列表、字典和集合等数据类型,快速生成一个满足指定需求的元组。Python 推导式是一种独特的数据处理方式,可以从一个数据序列构建另一个新的数据序列的结构体。
2024-10-16 21:07:57
313
原创 线性代数 学习 笔记
词频表示分词在分词列表中出现的次数,分别计算listA和listB中每个分词在列表中的词频freqMapA={这=1, 只=2, 皮靴=1, 号码=2, 大=1, 了=1, 那=1, 合适=1}对于一个 n×n 的方阵 A,如果存在另一个 n×n的方阵 B,使得 AB=BA=E,其中 E 是 n×n 的单位矩阵,那么 B 称为 A 的逆矩阵,记作。注:λ可以为0,而v不能为0,并且v是列向量。freqMapB={这=1, 只=2, 皮靴=1, 号码=1, 不=1, 小=1, 那=1, 更=1, 合适=1}
2024-10-14 17:23:29
1658
原创 线性代数 学习笔记
具体来说,如果 A 是一个m×n 的矩阵,那么它的转置矩阵 A^T 是一个 n×m 的矩阵,其中 A^T 的第 i 行第 j 列的元素等于 A 的第 j 行第i 列的元素。具体来说,如果A 是 一个 m×n 的矩阵,k 是一个标量,那么它们的数乘 kA 也是一个 m×n 的矩阵,其中 kA 的每个元素是 A 对应位置元素与标量 k 的乘积。给定一个 n×n的矩阵 A,其第 i 行第j 列的元素 aij的余子式 Mij是指去掉第i行和第j列后得到的 (n−1)×(n−1) 子矩阵的行列式。
2024-10-12 19:16:49
1148
原创 概率论 基础 学习
对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。整个曲线的面积=1,所以蓝色部分的面积=1-黄色部分面积=1-F(x),另外正态分布曲线是以y轴对称的,蓝色部分的面积=F(-x),所以:F(-x)=1-F(x)离散型随机变量函数的分布通常指的是如何从已知的离散型随机变量出发,通过某种函数关系得到新的随机变量,并确定这个新随机变量的概率分布。由上图可知,F(-x)是曲线中红色部分的面积,F(x)是曲线中黄色部分的面积,由分布函数的性质知,
2024-10-11 20:54:16
2109
原创 概率 基础 补习
P(A+B+C)相当于三个圆的公共部分,即图中蓝色部分,P(A)+P(B)+P(C)相当于三个圆相加,但是中间重叠部分(AC、AB、BC)被加了两次,所以需要减掉一次P(AC)、P(AB)、P(BC),在减掉P(AC)、P(AB)、P(BC)时最中间(三色重叠)的部分被减掉了,所以还要再加上P(ABC)条件概率用于描述在已知某一事件发生的情况下,另一事件发生的概率。所以条件概率定义公式中P(B)为B事件发生的总事件数概率,P(A∩B)是在B发生的条件下A发生的事件概率,即A和B共同发生的事件概率。
2024-10-10 19:31:42
863
原创 高数 学习 笔记
其中A、B不依赖于Δx, Δy,仅与x, y有关,ρ趋近于0(ρ=√[(Δx)²+(Δy)²]),此时称函数z=f(x, y)在点(x, y)当点 (x,y)从任意方式趋近于点 (a,b) 时,函数 f(x,y) 的值趋近于 L。可将(a,b)想象为(a,b,L)投影在二维平面的点。处可微分,AΔx+BΔy称为函数z=f(x, y)在点(x, y)处的全微分,记为dz即dz=AΔx +BΔy。如果 (x,y)从不同方式趋近于点 (a,b),函数 f(x,y) 的值不相等,则表示 f(x,y) 不存在。
2024-10-09 19:07:08
1877
原创 高数 基础补习
给定一个函数 f:X→Y,如果存在一个函数 g:Y→X,使得对于 X 中的每一个 x,都有 g(f(x))=x,并且对于 Y 中的每一个 y,都有 f(g(y))=y,则称 g 为f 的反函数,记作。函数 f(x) 当 x趋于无穷大时,如果存在一个常数 A,使得对于任意小的正数 ϵ,总存在一个正数 X,使得当 ∣x∣>X 时, ∣f(x)−A∣<ϵ,则我们说 f(x) 当 x 趋于无穷大时的极限是 A。首先,考虑曲线上的两个点 (a,f(a)) 和 (b,f(b)),其中 b 是接近 a 的另一个点。
2024-10-08 21:58:29
898
原创 python 学习 笔记
元组一但创建,里面的元素就不可再修改。如:x=(1,2,3,[4,5,6]),x[0]=10,像这样给元组的元素赋值会报错,但是,x[3][0]=99,像这样修改元组内列表元素的元素是可以的。dict.fromkeys(seq)创建一个新字典,以序列seq中元素做字典的键,val为字典所有键对应的初始值。s.update( x ) 添加元素到集合,且参数可以是列表,元组,字典等 ,x 可以有多个,用逗号分开。s.discard( x ):将元素 x 从集合 s 中移除,如果元素不存在,不会发生错误。
2024-09-30 22:18:42
773
原创 python 学习 笔记
如:x=(1,2,3,[4,5,6]),x[0]=10,像这样给元组的元素赋值会报错,但是,x[3][0]=99,像这样修改元组内列表元素的元素是可以的。x[3][1],表示取出列表x下标为3的元素,该元素又是一个列表,取出该列表下标为1的元素。列表+列表,list[]+list[],拼接,两个列表相加得到新列表,如:[1,2,3]+[2,3,4]=[1,2,3,2,3,4]ru:[1,2,3]*2=[1,2,3,1,2,3]len(list[]),返回列表长度,如:len([1,2,3]),返回3.
2024-09-29 18:48:19
609
原创 python 基础知识 学习 笔记
range中有0,1,2,3,4这5个数,j分别等于这五个数,并且print(j)打印了j。但是,在j等于2时break跳出了循环,因此只循环了两次,打印了0,1。range(),一个参数,包含[0,参数),两个参数range(x,y),包含[x,y),三个参数,range(x,y,z),z表示步长。当知道结构,不知道写什么执行体代码时,可以用pass占位,但运行程序时,pass只是让程序顺利运行,不起作用。跳过循环,当前这一段循环执行到continue时停止当前循环,执行下一次循环。
2024-09-27 18:52:59
404
原创 python 基础知识 学习
str=”hello”,str1=’hello’,str2=”””hello”””,str3=’’’hello’’’,双引号,单引号引号内内容不可以换行,如x=3 (0b011) y=2 (0b010) x|y=3(0b011)如x=3 (0b011) y=2 (0b010) x&y=2(0b010)如:x+=x+20等同x=x+(x+20)。与之相似,还有“-=”,“*=”,“/=”,“**=”,“%=”,“//=”。,x<y打印-1,x=y打印0,x>y打印1.python3以上废弃。
2024-09-26 20:18:35
884
原创 python学习笔记
在一个文本文件(最好以.py——表示python文件)中编辑python代码,进入python.exe目录下,通过cmd命令进入命令框,输入python。进入python.exe目录下,通过cmd命令进入命令框,输入python,敲下回车键。进入编译器,如PyCharm,创建项目,创建python文件,进行相关配置。两个单词间用“_”隔开,或使用驼峰命名法,如zhang_san,或者zhangSan。变量区分大小写,如jack=”100”,Jack=”1000”。一般由字母,下划线,数字组成。
2024-09-24 16:57:12
260
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人