- 博客(39)
- 收藏
- 关注
原创 PaddleOCR文字识别模型的FineTune
paddle框架为百度开发的深度学习框架,其中对于文字检测、识别具有较为便利的开发条件。同时PaddleOCR文字识别工具较为轻量化,并可按照任务需求进行model的finetune,满足实际的业务需求。在github中对该框架进行较为完整的描述,对于pretrainmodel、parameter进行明确的标注与说明,同时提供每日免费算力进行大模型的finetune,可以用于模型框架的初步认识与训练,满足实际的业务需求。
2024-12-28 17:13:50
1730
原创 Transformer--Decoder
解码器中,输入值为x ,memory,rc_mask,tgt_mask四个向量,通过对解码器层中self.layer进行遍历,对数据向量进行attention计算后,最后对数据进行标准化,进行数据的输出。解码器层同编码器层一样,需要数据输入后创建Q、K、V向量,通过依据向量之间的关系,构建attention机制,实现decoder layer层的实现。数据输出层 ,构建数据全连接层,采用softmax激活后进行数据的输出。
2024-12-28 16:23:48
594
原创 Transformer--Encoder
Transformer 采用encode、decode、机制进行特征的创建与提取操作。在模型中将输入通道分为编码器与解码器两部分构成,在编码器环节,将读取的数据进行位置编码、数量编码等构建向量矩阵,通过构建self-attention机制,进行自主学习数据模型中的Q K V矩阵,通过N个初始向量模型完成数据的add + Norm + Feed Forward操作。
2024-12-19 20:28:41
491
原创 小目标图像分类
一、数据来源数据来源为kaggle数据集中蝴蝶项目的特征分类,Butterfly Image Classification (kaggle.com)。其中,数据集大小为6850左右,为75分类。数据集图像大小为224x224,label采用csv数据集方式进行数据存储。网址:https://www.kaggle.com/datasets/phucthaiv02/butterfly-image-classification二、数据集划分首先对开源数据集进行训练集、验证集数据进行划分,划分比例按8:2进
2024-12-19 17:09:13
648
原创 SE注意力机制
论文来源:https://arxiv.org/pdf/1709.01507计算流程:当数据传入后,兵分两路进行数据计算,最后对各通道中数据乘对应权重完成通道注意力。
2024-12-12 20:15:25
693
原创 经典神经网络之ResNet
ResNet网络模型主要为在网络训练模型中,增加残差训练机制,按照”结果不会变的更坏“的处理原则,同时避免深度神经网络中梯度消失与过拟合的问题。
2024-12-12 19:54:46
1121
原创 CNN框架的基础认识
常见的视觉处理网络中,大家熟知的主要为,也称视觉神经网络。特点主要为在深度学习网络中采用conv的方式对图像进行卷积操作,进行图像的特征提取,最后采用flatten的方式全连接进行概率预测,从而达到图像目标的分类、目标检测、图像分割等相关工作。
2024-12-08 22:20:12
613
原创 搭建深度学习框架+nn.Module
最终成品的项目框架如下图,最终实现的效果,通过自己配置的框架函数,对模型进行定义与参数调配。同时在参数配置的过程中可选择是否进行模型初始化参数的使用。适用于YOLO框架的初认识。了解此框架可更好的认识YOLO框架。
2024-11-30 15:54:20
795
原创 一篇文章了解机器学习(下)
1、主要应用场景为分类的问题。采用“树”的理念,通过计算数据的信息熵确定树的根节点、channel,从而加快数据分类。
2024-11-20 09:47:19
366
原创 一篇文章了解机器学习
fit_transform == 对训练器中中的数据进行计算 ,将初始化后的模型对原始数据进行转换。Scikit-learn官网:https://scikit-learn.org/stable/#transform == 将保存在训练器中的参数 进行调用,对数据进行 标准归一化操作。fit == 对训练器中的模型参数进行初始化 , 将数据保存在transfer中。(2)中文词频的计算 == 在库中导入jieba分词器。主要保留的特征为==信息波动大,方差大的数据进行保留。(1)数据最大最小化。
2024-11-19 21:22:37
480
原创 PyQt5+Opencv人脸识别
7、创建click事件,点击按钮进行不同事件的反馈。以点击文件路径选择为例。最终点击按钮后在文本框中输出选中的image或video的路径信息。6、在窗口中添加整体布局。2、创建参数与显示布局。4、创建运行与停止布局。5、创建image布局。1、创建顶部模型布局。.3、创建数据源布局。
2024-11-19 19:52:46
339
原创 opencv-第一天
图像的映射操作 = 对图像中x,y的二维矩阵进行操作,按要求对矩阵进行处理后进行映射,达到相对于的处理效果。三、图像的色彩转换 == 主要目的 == 减小空间计算的维度 == 复杂度,降低计算量。一、自定义图像显示窗口,读取图片。二、opencv的常规操作。
2024-11-02 21:44:00
156
原创 pandas-第六天
注:可以用于时间相关的操作 == 定期清理、验证码有效期等。labels == columns//index == 只可以是这两个数据。第二种:使用concat函数 == 要求concat行拼接。时间日期格式化:== 目的将字符串类型和datetime类型进行相互转换。第一种:df.loc[index] = [x,y,z]inplace == 是否在当前df中进行数据剔除。axis == 对行/列数据进行剔除。fillna() 进行空值的填充。三、df数据的按行遍历。空值的检测和空值填充。
2024-10-28 21:50:43
210
原创 pandas-第四天
df['mean'] = df.groupby(['Age','Sex'])['money'].transfrom(lambda x : x.mean()) ==对df按年龄、性别进行分组,求每个年龄段money的平均值。df['mean'] = df.groupby('Age')['money'].transfrom(lambda x : x.mean()) ==对df按年龄进行分组,求每个年龄段money的平均值。== keep =first == 保留第一个重复的数据,其他的数据删除。
2024-10-25 21:07:46
255
原创 pandas-第四天
df.drop(labels,axis,index,columns,inplace) == 注labels与columns作用一致,为删除df中某列的数据。df.insert(loc,column,value) == 按照loc的位置创建名字为column的新列,列的内容为value。df.loc[行标签:列标签] == 其中可以采用bool值进行指标的索引进行数据的筛选 == 按标签进行筛选。df.prod() == 按列计算数的乘积 == 默认。df.values() == 返回df的值。
2024-10-24 21:45:07
261
原创 matplotlib-——第三天
= 将画布按shape进行分割,每一张图像按loc位置起始开始绘图,按rows、cols进行占位。注:当row、now为二维数组时,按照矩阵下标索引的方式进行aix位置的定义。注“从左向右从上到下进行排列。
2024-10-23 21:04:05
183
原创 numpy-第二天
np.append(arr,values,axis=none/0/1) == 对arr按values进行数据增加,当axis=None时,自动压缩成一维数组在最后进行value数据的append。== 对arr在指定的axis前进行维度创建axis = 0,第一个[]前,axis=1,第二个[]前,axis=3,第三个[]前。flags = ['multi_index'] == 返回每个元素的索引值。= 对数组进行转置 == np.transpose(arr,(shape)) == 对数组进行转置。
2024-10-22 21:57:08
582
原创 python库-numpy(第一天)
endpoint = False :(start - stop) / (num ) == 提取num+1点,平均分num份 ,最后将stop点删除。arr.shape = (2,3) == 对arr的shape进行修改。endpoint = True :(start - stop) / (num -1) == 提取num点,平均分num-1份。np.linspace(start,stop,num,endpoint) == 生成一定数值区间的等分数值点。== 构建数组进行数组运算。
2024-10-21 22:06:51
255
原创 类与对象(第三天)
yield :在循环中可以依次输出循环列表中的内容,当输出后,循环暂停,当值使用后循环继续。注:super函数可以调用父类中函数的用法,同时可以解决重复调用、钻石继承等问题。读取迭代器中的内容(next(iter))== 每次读取一个数值 == 超出索引时会报错。3、函数闭包的特点 == 主函数生成后 函数栈帧不会立即释放,等待内部函数进行执行。a = xxx # 类变量//全局变量 == 类中的所有人均可以调用。def xxx(self,xxx): # 实例化方法==函数。
2024-10-18 22:28:50
601
原创 类及类方法(第三天)
self == 对对象本身的调用 == 自己引用自己,实例化后的自己 name = Dxx() ,则name可以调用Dxx()内的所有函数、属性以及方法。def xxx (cls,xxx): === 类方法 == 目的可以访问类属性,对类属性进行修改 === xxx为其他参数。def xxx (cls): === 静态方法 == 可以访问类属性,不可以访问实例属性 == 可以默认为简单的封装函数。cls == 类方法 == 可以调用类的属性 或 其他类方法。实例属性 == 参数。
2024-10-17 22:58:46
260
原创 函数(第二天)
= 当函数没有return值时,当输入不可变变量,调用函数时,不会修改变量的值。== 函数内部的变量,当调用函数时,局部变量产生,创建新的存储空间,当函数调用结束时,局部变量解散消失。== 参数定义的先后顺序 ,位置参数 >*>a>**>默认参数。== 主要为数据存储指引的关系区别 == 同深拷贝与 浅拷贝机理。== 无返回值时 根据变量的类型影响对全局变量做不同的影响 === 可变、不可变。== 当输入可变变量时,调用函数,会修改变量的值。==global == 主要为函数定义外的变量。
2024-10-16 20:42:51
410
原创 python基础(第一天)
浅拷贝:当数据赋值或者切片后,仅对数据表层数据进行赋值、切片,对列表内指引数据未处理。深拷贝==更新数据后不会对原列表数据进行修改。浅拷贝==更新数据后对原列表数据同样进行修改。深拷贝:对表层数据及指引数据全部进行拷贝。目的:节约代码量,使得代码显示更加的简洁。一、深拷贝与浅拷贝认识加深。数据存储与指引之间的关系。
2024-10-15 20:39:28
198
原创 线性代数(第六天)
4、同时注意对称矩阵与反对称矩阵。==对称矩阵 主对角线数据为1,其余按1对称。反对称矩阵 主对角线为0,其余按0反对称(a = -a)。三、余弦相似度算法==复现文本相似度比较==通过计算词组出现的频率构建词组的向量。通过比较A B 向量的余弦相似度计算A B语句的相似性。注:特征值与特征向量==目的提取出矩阵的特征值与特征向量,通过计算二者的值,快速计算矩阵的值。注:1、矩阵的计算 m x n ** n x p == m x p。3、矩阵转置 m x n 转置后 n x m。
2024-10-14 16:48:36
301
原创 线性代数(第五天)
=思路:当不同数据的量级对数据分析结果产生影响时(A:100,99,98 === 期望为99;B:0.1 0.09 0.08 === 期望值为0.09===二者进行比较分析时会忽略事件B产生的影响而单纯考虑事件A产生的影响。为减少数据之间因数据量级造成数据均值不一致,引发事件波动量级不一致,对数据进行标准化处理==得到数据的相关性系数。,在大数据中抽取小样本,小样本与大数据的均值、方差、标准差等均满足相同的值,并且满足高斯分布。1、注:期望为事件发生的均值(平均值),方差为事件发生在均值附近的波动程度。
2024-10-13 10:56:02
302
原创 联合概率(第三天)
1、概率密度函数为分布函数的导数。通过计算概率密度函数积分,计算特定条件下事件发生的概率。注:累计分布函数有右连续性。==连续型(左右均连续)、离散型(右连续左跳跃)1、离散型分布函数有:0-1分布、二项分布、几何分布、泊松分布。2、连续型分布函数有:均匀分布、指数分布、正态分布(高斯分布)通常概率密度函数为范围为正负无穷时,事件发生的概率为1。离散型和连续型:关注新函数与原函数的定义域、值域的划分。2、分布函数又称累计分布函数。== 累计值为1。一、概率密度函数与分布函数。四、多维随机变量及分布。
2024-10-11 22:09:45
176
原创 事件概率(第一天)
1、常见的概率公式有:古典概率模型、排列组合、几何概率模型、频率等。其中用来计算事件发生的概率公式有古典概率模型、几何概率模型(有计算公式推导为依据);2)贝叶斯计算公式:已知事件B发生的概率,求事件B是在哪个A中发生的。1)全概率计算公式:已知不同情况A下事件B发生的概率,求事件B发生的概率。事件之间常见的关系有:并集、交集、差集、包含、互斥、对立、独立等几种。1、常见的事件种类有:基本事件、复合事件、必然事件、不可能事件四种。4、条件概率:常规定义为事件B发生的条件下,事件A发生的概率。
2024-10-10 20:56:57
518
原创 高等数学(第二天)
多元函数主要为将平面图形进行立体化,从而对三维等高维度图形进行求解。梯度为一个向量,为某一点处变化速率和变化方向均最大的一个点。实际问题中,通常采用梯度的模与阈值的比较进行寻优与模型优化。主要的理论思想:对图形进行无限切割后进行累加。1、作用:定积分主要用于求取不规则图形的面积。2、牛顿-莱布尼茨公式。
2024-10-09 20:56:34
212
原创 高等数学(第一天)
注:例如:y = 1/(x -a ),当x=a时,函数无意义。除需要进行单独分析。==高阶无穷小,低阶无穷小,同阶无穷小,等价无穷小。3)通过判定函数的凹凸性,对函数的极大值、极小值进行求解==获得局部最优解。当一阶导数等于0,二阶导数大于0,结果为凹函数。函数的种类:主要关注的函数有分段函数,反函数,隐函数等。衍生极限的概念:当x➡a时,y➡∞。注:连续不一定可导,可导一定连续。函数凹凸性发生转变的点==拐点。例如:瞬时速率、瞬时斜率等。1、导数的作用:求瞬时。1、无穷大、无穷小。求一阶导数==求斜率。
2024-10-08 20:44:28
214
原创 基础语法复习-字典
当一个字典数据中相同的key值被赋值两次,则会按照代码的运行逻辑对字典数据进行更新。1)key的值具有一定的唯一性,同时key为任意不可变数据==数据、字符串、元组。元组的主要应用范围为:函数的使用、多变量赋值==主要用于多变量的定义与同时赋值。2)集合只可以保存不可变数据,可变数据(列表、字典……5)集合具有去重的能力,可以将列表、字典等转换为集合,从而达到去重的目的。4)空集合的创建方式:s1 = set({})2、数据集的拆分==训练集测试集底层代码逻辑。3)集合的表达方式 s1 = {}
2024-10-01 13:54:27
226
原创 列表及元组
列表是一种支持多种数据结构数据类型的数据容器,其中可以将所有的数据类型进行存储,通过下角标索引的方式对数据列表中的值进行调用读取。注:通过对列表进行切片时,列表中的数据将重新存储在新的列表空间。但列表中的列表将引用原存储空间进行存储(浅拷贝)。第一种读取列表的方式为:通过计算列表的长度,获取列表中所拥有的元素个数,通过索引数据下角标的方式进行数据读取。列表中数据的读取方式主要通过索引列表的下角标对列表进行读取(get)其中数据的方式。第二种数据读取方式为:直接对列表中数据进行遍历,依次读取列表中数据值。
2024-09-29 20:03:57
407
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人