- 博客(49)
- 收藏
- 关注
原创 机器学习-无量纲化与特征降维(一)
无量纲,即没有单位的数据无量纲化包括""和"",这样做有什么用呢?假设用欧式距离计算一个公司员工之间的差距,有身高(m)、体重(kg)以及收入(元)三个标准,正常情况下,收入带来的差距会很大,且看下面的公式:从计算上来看, 发现身高体重对计算结果没有什么影响, 基本主要由收入来决定了,但是现实生活中,身高是比较重要的判断标准. 所以需要无量纲化.
2025-05-09 22:02:46
764
原创 机器学习-数据集划分和特征工程
参数:- arrays:多个数组,可以是列表,numpy数组,也可以是dataframe数据框等- options:(包含以下参数)- shuffle = True 默认随机抽取- random_state=x,随机数种子,x是哪个都行,就是随机抽取的规则,保证每次都一样- train_size=x,就是训练集的比例,默认是0.75,和test_size两者选一个就行- stratify,如果数据集是多分类,则需要指定,比如是二分类,则指定为y(分层划分,这个留到后面再讲)
2025-05-09 16:52:36
1972
原创 机器学习-简要与数据集加载
机器学习即在数据中总结规律并预测未来结果,这一过程仿照人类的学习过程进行。是机器学习中的重要算法的其中之一,是一种偏近现代的算法。
2025-05-06 22:25:34
2155
原创 图像预处理-图像亮度变换
像素强度整体变高或者变低。:暗处像素强度变低,亮处像素强度变高,从而中间某个的显示精度。:需要通过一起控制。:通过控制。比如,图像中一点的像素为160,一点为10,我想增强对比度,那就是让这两点更大。可以让为1.5,这样两点像素值就分别变成了240和15,然后为10,就变成了250和25,差异就更大了。
2025-04-25 22:48:52
1194
原创 图像预处理-霍夫变换
是图像处理的一种技术,主要用于检测图像中的等几何形状。基本思想就是将图像空间()中的点映射到中,通过在参数空间中寻找实现对特定形状的检测。
2025-04-24 22:48:59
976
原创 图像预处理-模板匹配
就是用在中不断的,通过某种比较方法来判断是否匹配成功,找到模板图所在的位置。有。- 类似于,滑动比较,挨个比较象素。- 返回结果大小是:目标图大小-模板图大小+1。
2025-04-23 22:06:58
1270
原创 图像预处理-图像轮廓特征查找
其实就是,有了轮廓点就可以找到最上、最下、最左、最右的四个坐标(因为有xmin,xmax,ymin,ymax)。就可以绘制出矩形。
2025-04-21 21:15:38
724
2
原创 图像预处理-图像噪点消除
噪声:指图像中的一些干扰因素,也可以理解为有那么一些点的像素值与周围的像素值格格不入。常见的噪声类型包括高斯噪声和椒盐噪声。滤波器:也可以叫做卷积核- 低通滤波器是模糊,高通滤波器是锐化- 低通滤波器就是允许低频信号通过,在图像中边缘和噪点都相当于高频部分,所以低通滤波器用于去除噪点、平滑和模糊图像。高通滤波器则反之,用来增强图像边缘,进行锐化处理。注意:椒盐噪声可以理解为斑点,随机出现在图像中的黑点或白点;高斯噪声可以理解为拍摄图片时由于光照等原因造成的噪声。这是高斯噪声这是椒盐噪声,有很多黑白的或者孤立
2025-04-18 21:58:56
946
原创 图像预处理-添加水印
类似图片,但是原理是基于Numpy数组的操作(切片是会修改原图数据的),也就是说这个“裁剪”不是为了保存“裁剪”部分,而是为了等处理。
2025-04-17 22:47:22
542
原创 图像预处理-图像掩膜
通常是一个图像,并且与原图像的大小相同,其中目标区域被设置为1(或白色255),而其他区域被设置为0(黑色),并且目标区域可以根据的颜色范围进行修改。
2025-04-16 22:36:46
990
原创 图像预处理-色彩空间补充,灰度化与二值化
颜色空间使用(Hue)、(Saturation)和(Value)三个参数来表示颜色一般对颜色空间的图像进行有效处理都是在HSV空间进行的,然后对于基本色中对应的HSV分量需要给定一个严格的范围,下面是通过实验计算的模糊范围(准确的范围在网上都没有给出)。: 0— 180: 0— 255: 0— 255人类对颜色的感知方式:人类对颜色的感知是基于和三个维度的,而HSV颜色空间恰好就是通过这三个维度来描述颜色的。因此,使用HSV空间处理图像可以更直观地调整颜色和进行色彩平衡等操作,更符合人类的感知习惯。
2025-04-15 23:41:05
1327
原创 图像预处理-插值方法
当我们对图像进行缩放或旋转等操作时,需要在新的像素位置上计算出对应的像素值。而插值算法的作用就是根据已知的像素值来推测未知位置的像素值。
2025-04-12 17:38:30
796
原创 图像预处理-翻转与仿射变换
参数指定翻转类型的标志,为0,表示沿x轴翻转,>0(默认1) 表示沿y轴翻转,为 <0(默认-1) 表示水平+垂直翻转。
2025-04-12 12:51:57
838
原创 DataFrame操作(扩充)
将两个对象根据一个或多个键进行合并,类似于 SQL 中的 JOIN 操作参数::左侧的对象。:右侧的对象。:合并方式,可以是 ''、''、'' 或 '默认为 '- '':内连接,返回两个共有的键。- '':外连接,返回两个的所有键。- '':左连接,返回左侧的所有键,以及右侧匹配的键。- '':右连接,返回右侧的所有键,以及左侧匹配的键。:用于连接的列名。如果未指定,则使用两个中相同的列名。和:分别指定左侧和右侧的连接列名。和:布尔值,指定是否使用索引作为连接键。
2025-04-08 20:40:16
865
原创 DataFrame行索引操作以及重置索引
只能使用标签索引,不能使用整数索引。当通过标签索引的切片方式来筛选数据时,它的取值前闭后闭。传参:1.如果选择单行或单列,返回的数据类型为2.选择多行或多列,返回的数据类型为3.选择单个元素(某行某列对应的值),返回的数据类型为该元素的原始数据类型(如整数、浮点数等)。参数::行标签或布尔数组。:列标签或布尔数组。
2025-04-03 21:32:51
1600
原创 DataFrame基础
的每一行或列数据都可以看成一个 Series 结构,只不过,为这些行中每个数据值增加了一个列或行标签。同一样,自带行标签索引,默认为“隐式索引”即从 0 开始依次递增,行标签与中的数据项一一对应当然你也可以用“显式索引”的方式来设置行标签。
2025-04-02 21:33:22
1489
原创 Pandas基础及series对象
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据- Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征- Pandas 广泛应用在学术、金融、统计学等各个数据分析领域- Pandas 的出现使得 Python 做数据分析的能力得到了大幅度提升,它主要实现了数据分析的五个重要环节:加载数据、整理数据、操作数据、构建数据模型、分析数据。
2025-04-02 21:18:47
1096
原创 Matplotlib绘制常用图像
柱状图的 X 轴位置,就是柱子的标签。: 柱状图的高度,就是y的值。: 柱状图的宽度,默认为 0.8。: 柱状图的底部位置,默认为 0,也就是原点叫啥名取啥值。: 柱状图与标签的对齐方式,可以是 'center'(居中对齐)或 'edge'(边缘对齐)。: 其他可选参数,用于定制柱状图的外观,如 color、edgecolor、linewidth 等。
2025-03-31 21:04:49
873
原创 Matplotlib基本使用
是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像。Matplotlib 图形组成::指整个图形,可以把它理解成一张画布,它包括了所有的元素,比如标题、轴线等:绘制 2D 图像的实际区域,也称为轴域区,或者绘图区:指坐标系中的垂直轴与水平轴,包含轴的长度大小(图中轴长为 7)、轴标签(指 x 轴,y轴)和刻度标签。
2025-03-29 18:30:53
996
原创 Numpy用法(三)
如果元素数量不够,重复数组元素来填充新的形状(这就是它与shape和reshape的区别)。原来的形状是: (2, 3)补齐后的形状是: (3, 3)[[1 2 3][4 5 6][1 2 3]]原来的形状是: (2, 3)补齐后的形状是: (2, 2)[[1 2][3 4]]
2025-03-29 18:19:39
1098
原创 Numpy用法(二)
可以改变数组维度,但是返回的是一个新的数组,原数组的形状不会被修改.后产生的新数组是原数组的一个视图,即它与原数组共享相同的数据,但可以有不同的形状或维度,且对视图的修改会直接影响原数组数据。:新形状中的元素总数必须与原数组中的元素总数相同,即(2,3)可以改成(3,2)而不能是(2,2)[[1 2 3][4 5 6]][[1 2][3 4][5 6]]作为占位符:你可以使用作为占位符,让 numpy 自动计算某个维度的大小。也就是-1在哪,就会自动改变那个行或列的大小以适配新的形状。
2025-03-28 21:08:46
1431
原创 Numpy用法(一)
ndarray 对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。a[x , y],x 为行索引,y 为列索引。x,y的格式都是 a : b : c ,其中 a,b,c 为整数,a 为起始索引,b 为结束索引,c 为步长。
2025-03-28 15:36:37
1192
原创 git的进阶使用
举个简单的例子,公司里两个人(A,B)同一天上班,都拉取了远程仓库数据。然后A做完了所有的工作,进行了x文件的修改并提交至远程仓库。而B在做自己工作的时候不小心或者需要修改x文件,B认为A没有操作x文件直接push没有问题。但是程序会报错,提醒B将远程仓库的内容pull,pull后x文件包含了A和B的修改,需要两个人联系如何整合代码,整合后再push进远程仓库。步骤就是:push 失败 — pull — 整合代码 — pushHEAD。
2025-03-25 21:27:56
844
原创 python-模块与包
模块是一个Python文件,每个文件就是一个模块- 通过语句导入模块中的内容- 一个项目拆分成多个模块会更方便阅读理解,更具有模块化- 模块导入后可以使用其中的变量、函数、类等。
2025-03-23 13:23:33
759
原创 python异常处理
编程时难免遇到问题,遇到问题时会导致其后代码不执行。为了解决,这里就使用了异常处理让程序继续执行。异常处理的好坏决定这个程序的鲁棒性。
2025-03-23 13:10:38
846
原创 迭代器与生成器
class A:self.x = 1# 自定义iter魔术方法,将对象返回为一个可迭代对象# 自定义next魔术方法,返回迭代的下一个值return 100a = A()print(i)100 100...13 a = A()657由此可见,尽管是数字,只要自定义了`iter`魔术方法就可以让它变成一个可迭代对象。而next的返回值自定义后会作为每次迭代的返回值。for循环就很容易陷入死循环,因为next没有设置打断的条件。
2025-03-23 13:01:06
971
原创 OOP基本特性
封装是指将对象的属性和方法包装在一起,对外隐藏实现细节,只提供必要的接口给外部访问。- 在Python中,通过方法初始化属性,并通过方法来操作这些属性。- 以 __ 开头的属性或方法是私有的,在无法直接使用- 可使用属性和方法控制外部访问。
2025-03-21 21:12:11
934
原创 python类与对象(二)
类方法属于类,指定由类来访问,但类和该类的实例都可以调用类方法- 类方法需要使用@classmethod装饰器定义- 类方法至少有一个形参用于绑定类,约定为cls- 类方法不能访问此类创建的对象的实例属性,只能访问类属性11fun21fun21来个用得到类方法的案例,常常用作方法,即批量生产。
2025-03-20 21:31:02
991
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅