- 博客(77)
- 收藏
- 关注
原创 RNN-day2-循环神经网络
循环神经网络(Recurrent Neural Network,RNN)是一种神经网络结构,专门用于处理序列数据。与传统的前馈神经网络不同,RNN 在内部具有反馈连接,允许信息在网络内部传递。这种结构使得 RNN能够对序列数据的历史信息进行建模,并在一定程度上具有记忆能力。在自然语言处理领域,RNN 被广泛应用于语言建模、机器翻译、情感分析等任务。通过捕捉单词之间的上下文信息,RNN 能够更好地理解语言的含义和结构。
2025-02-08 16:35:35
634
原创 YOLO-day3-YOLO8&11
速度和精度的优化采用更先进的网络结构和训练技巧,支持多种检测任务,包括目标检测和跟踪、实例分割、图像分类和姿态估计等。优化了推理速度,使其在实时应用中表现更佳。源码下载:项目的主线,通常代表最新的稳定代码。指定版本的稳定发布版本,例如v1.0v2.0等,用于长期维护,BUG较少。
2025-02-08 16:32:21
101
原创 YOLO-day1-YOLO1-4
更快更简单:45fps,远高于Faster R-CNN,满足视频目标检测避免产生背景错误:整张图进行输入,充分利用上下文,不易出现错误背景信息IOU损失定义如下:交集越大,损失越小,解决了大目标对小目标的影响$$$$
2025-02-08 16:30:52
118
原创 CNN-day10-经典神经网络MobileNet V1&V2&V3
传统的卷积神经网络参数量大,导致预测时算力大,对于手机、嵌入式等移动设备来讲部署慢且占用空间,无法满足需求。2017年,Google提出的移动端高效率模型MobileNet:相比VGG16,分类准确率下降了0.9%,但是模型参数仅仅是VGG16的1/32到1/33。
2025-02-08 16:25:23
881
原创 CNN-day9-经典神经网络ResNet
深层网络有个梯度消失问题:模型变深时,其错误率反而会提升,该问题非过拟合引起,主要是因为梯度消失而导致参数难以学习和更新。
2025-02-08 16:24:47
444
原创 CNN-day7-经典神经网络VGG
VGG的亮点在于它通过堆叠多个卷积层,以小的卷积核和池化层的方式来增加网络深度,从而实现高精度的图像识别。这种方法可以有效地捕获图像中的高级特征,并通过不断拟合训练数据来提高识别准确率。
2025-02-08 16:22:54
620
原创 CNN-day6-经典神经网络AlexNet
ImageNet大规模视觉挑战赛(ILSVRC)被称为深度学习在图像分类任务研究方面进展的标杆。AlexNet网络参加了ILSVRC2012年大赛获得冠军(超过第二名10%的性能),掀起了一波深度学习的浪潮,。
2025-02-08 16:22:05
653
原创 CNN-day5-经典神经网络LeNets5
super(LeNet5s, self).__init__() # 继承父类# 第一个卷积层nn.Conv2d(in_channels=1, # 输入通道out_channels=6, # 输出通道kernel_size=5, # 卷积核大小),nn.ReLU(),# 池化:平均池化# C3:3通道特征融合单元# C3:4通道特征融合单元# C3:4通道特征融合单元,剔除中间的1通道# C3:6通道特征融合单元# S4:池化# 全连接层。
2025-02-08 16:20:41
1003
原创 11111
GitHub - SaoYan/LearnToPayAttention: PyTorch implementation of ICLR 2018 paper Learn To Pay Attention (and some modification)
2024-12-13 19:56:26
98
原创 CNN-day4-迁移学习与模型优化
import os#导入需要的模型,如果是自己训练的模型要在同目录下#生成验证数据#关闭科学计数法打印#路径兼容处理#验证过程记录表格路径#1.验证数据transform=transforms.Compose([transforms.ToTensor(),transforms.Resize(32)#输入是32]))#2.模型:训练好的模型#初始化到模型#移到GPU上#3.使用训练好的模型对验证数据进行推理,看效果accuracy=0#总的数据保存#使用模型对数据进行推理。
2024-12-05 20:25:47
857
原创 CNN-day2-池化
池化层 (Pooling) : 主要对卷积层学习到的特征图进行下采样(SubSampling)处理,可以降低空间维度, 缩减模型大小,提高计算速度。分类:1.最大池化max pooling:从每个局部区域中选择最大值作为池化后的值,可以保留局部区域中最显著的特征,在提取图像中的纹理、形状等方面具有很好的效果。2.平均池化 avgpooling:从每个局部区域中取平均值作为池化后的值,可以得到整体特征的平均值,在提取图像中的整体特征、减少噪声等方面具有较好的效果。
2024-12-03 19:54:54
1181
原创 CNN-day1 卷积
全连接网络在输入图像很大的时候计算成本高,图像也很难保留原有的特征,导致图像处理的准确率不高。卷积神经网络(Convolutional Neural Network,CNN)是专门处理具有网格状结构数据的深度学习模型。它是含有卷积层的神经网络,用来自动学习、提取图像的特征。构成:卷积层:提取图像中的局部特征池化层:大幅度降低运算量并进行特征增强全连接层:输出想要的结果。
2024-12-02 19:37:36
850
原创 深度学习day8-批量标准化+项目
Batch Normalization (批量归一化)是经常使用一个网络层,其主要的作用是控制数据的分布,加快网络的收敛原因:神经网络的学习其实在学习数据的分布,随着网络的深度增加、网络复杂度增加,一般流经网络的数据都是一个 mini batch,每个 mini batch 之间的数据分布变化非常剧烈,这就使得网络参数频繁的进行大的调整以适应流经网络的不同分布的数据,给模型训练带来非常大的不稳定性,使得模型难以收敛。
2024-12-02 19:36:03
1187
原创 深度学习day7-BP之梯度下降,过拟合与欠拟合
动量项更新:利用当前梯度和历史动量来计算新的动量项。权重参数更新:利用更新后的动量项来调整权重参数。梯度计算:在每个时间步计算当前的梯度,用于更新动量项和权重参数。没有对学习率进行优化。
2024-11-28 19:42:50
908
原创 深度学习day6- 损失函数和BP算法1
输出层-softmax多分类,使用交叉熵损失函数输出层-sigmid二分类,使用二分类交叉熵损失函数线性回归-smoothL1损失函数/均方差损失L2Loss。
2024-11-27 19:35:30
826
原创 深度学习day5-初始化与激活函数
人工智能:为机器赋予人的智能机器学习:一种实现人工智能的方法深度学习:一种实现机器学习的技术传统机器学习算法依赖于人工设计特征、提取特征,而深度学习模仿人脑的运行方式,从大量数据中学习特征,依赖算法自动提取特征,可解释性差。常用于:图像处理,自然语言处理,语音识别,自动驾驶,LLM,机器人。
2024-11-26 20:24:45
787
原创 深度学习day1-Tensor 1
PyTorch会将数据封装成张量(Tensor)进行计算,所谓张量就是元素为相同类型的多维矩阵。张量可以在 GPU 上加速运行。
2024-11-20 19:37:19
830
原创 机器学习day7-线性回归3、逻辑回归、聚类、SVC
J(w) = \frac{1}{2m} \sum_{i=1}^{m} (h_w(x^{(i)}) - y^{(i)})^2+\lambda\sum_{j=1}^{n} w_j^2,w_j指所有的权重系数, λ指惩罚型系数,又叫正则项力度。n 是样本数量, p 是特征的数量, y_i 是第 i个样本的目标值, x_i 是第 i个样本的特征向量, w是模型的参数向量。模型在训练数据上表现得非常好,在新的数据上表现较差,常发生在模型过于复杂,学习了数据的真实模式、噪声和异常值。小于阈值认为是负例,输出0。
2024-11-19 20:12:17
1160
原创 机器学习day6-线性代数2-梯度下降
③.g0,表示切线斜率为正,表示在导数为0的w值的右边,将w往左调小不断逼近导数为0的w值。对w_1求导,就是把w_2看成一个常数: loss(w1)’=2(w_1-3.5)+0+3w_2-4.5=2w_1+3w_2-11.5。对w_2求导,就是把w_1看成一个常数: loss(w2)’=0+2(w_2-2)+3w_1+2=2w_2+3w_1-2。中损失函数对于参数w的梯度就是此时w的切线斜率。
2024-11-18 17:19:48
1062
原创 机器学习day5-随机森林和线性代数1最小二乘法
在坐标轴上画出对应的点(离散或者连续),如果是离散的点,需要找一条直线使得这些点尽可能多地在这条直线上,或者能够尽可能均匀地分布在这条直线的两边,达到损失值最小的目标,使其尽可能地接近能够进行准确预测的目标函数(最优直线)人工智能中的线性回归:数据集中很难找到一个完美的方程式完全满足所有的目标值,通过给出的数据集去拟合一条直线尽可能满足所要求的模型关系,从而得到对应的尽可能准确的目标值。用这n个样本来训练一个决策树。回归的目的是预测数值型的目标值y,求回归系数的过程就是回归,根据回归系数可以得到预测值。
2024-11-15 19:36:45
890
1
原创 机器学习day4-朴素贝叶斯分类和决策树
(Gini Index)是决策树算法中用于评估数据集纯度的一种度量,基尼指数衡量的是数据集的不纯度,或者说分类的不确定性。P(A):"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。计算根节点的信息熵-计算属性的信息增益-划分属性-剔除根节点属性,再次计算根节点信息熵和属性的信息增益。对于一个二分类问题,如果一个节点包含的样本属于正类的概率是 (p),则属于负类的概率是 (1-p)在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。
2024-11-14 19:09:32
1349
原创 机器学习day3-KNN算法、模型调优与选择
1.实例化预估器(估计器)对象(estimator), 预估器对象很多,都是estimator的子类(1)用于分类的预估器sklearn.neighbors.KNeighborsClassifier k-近邻sklearn.naive_bayes.MultinomialNB 贝叶斯sklearn.linear_model.LogisticRegressioon 逻辑回归sklearn.tree.DecisionTreeClassifier 决策树。
2024-11-13 19:11:58
1178
原创 机器学习day2-特征工程
转换器对象调用fit_transform(data)函数,参数data为一维字典数组或一维字典列表,返回转化后的矩阵或数组。DOK 格式使用一个字典来存储非零元素,其中键是元素的位置(通常是元组 (row, column)),值是非零元素本身。其中一个列表包含每一行的非零元素,另一个列表包含了这些非零元素的列索引。矩阵中的大部分元素都是非0的,矩阵的存储通常采用标准的二维数组形式。词频(Term Frequency, TF), 表示一个词在当前篇文章中的重要性,是对词数的归一化。|ρ|
2024-11-12 20:20:13
1068
原创 opencv-day5-基于guI和pymsql进行的人脸识别案例
sg.Button("人脸采集", size=(10, 1)),sg.Button("退出", size=(10, 1))],[sg.Button("人脸识别", size=(10, 1)),sg.Button("退出", size=(10, 1))],window =sg.Window("视频播放",layout,location=(350,50),size=(800,500))[sg.Text("编号:", size=(10, 1)), sg.InputText()],
2024-11-06 20:05:34
1039
1
原创 opencv-day4-人脸识别案例
是一个非常流行的 Python 库,专门用于人脸识别任务。它基于 dlib 库和 HOG(Histogram of Oriented Gradients)特征以及深度学习模型,提供了简单易用的接口来进行人脸检测、面部特征点定位和人脸识别。库由 Adam Geitgey 开发,旨在简化人脸识别任务,容易上手。主要功能人脸检测检测图像中的人脸位置。支持使用 HOG 特征或 CNN(卷积神经网络)进行人脸检测。面部特征点定位检测人脸上的关键特征点(如眼睛、鼻子、嘴巴等)。人脸识别。
2024-11-05 16:35:49
786
原创 opencv-day2-图像预处理1
在计算机视觉和图像处理领域,图像预处理能够提高后续处理(如特征提取、目标检测等)的准确性和效率。常见的图像预处理操作:图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学。
2024-11-01 16:53:16
1296
1
原创 opencv-day1-基础
OpenCV的全称是Open Source Computer Vision Library,是一个开放源代码的计算机视觉库OpenCV可用于开发实时的图像处理,计算机视觉以及模式识别程序,目前在工业界以及科研领域广泛采用:OpenCV 是计算机视觉领域的标准库之一,广泛应用于图像识别、物体检测、人脸识别、手势识别等。:在机器人导航、环境感知和交互中,OpenCV 用于处理传感器数据和视觉信息。:在医学影像分析中,OpenCV 用于图像增强、分割和特征提取。
2024-10-31 19:58:30
802
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人