谢眠-优快云博客

原创 RNN-day2-循环神经网络

循环神经网络（Recurrent Neural Network，RNN）是一种神经网络结构，专门用于处理序列数据。与传统的前馈神经网络不同，RNN 在内部具有反馈连接，允许信息在网络内部传递。这种结构使得 RNN能够对序列数据的历史信息进行建模，并在一定程度上具有记忆能力。在自然语言处理领域，RNN 被广泛应用于语言建模、机器翻译、情感分析等任务。通过捕捉单词之间的上下文信息，RNN 能够更好地理解语言的含义和结构。

2025-02-08 16:35:35 684

原创 RNN-day1-NLP基础

NLP基础。

2025-02-08 16:34:53 986

原创 YOLO-day5-项目及思考

5。

2025-02-08 16:33:29 138

原创 YOLO-day4-综合项目

4。

2025-02-08 16:32:54 112

原创 YOLO-day3-YOLO8＆11

速度和精度的优化采用更先进的网络结构和训练技巧，支持多种检测任务，包括目标检测和跟踪、实例分割、图像分类和姿态估计等。优化了推理速度，使其在实时应用中表现更佳。源码下载：项目的主线，通常代表最新的稳定代码。指定版本的稳定发布版本，例如v1.0v2.0等，用于长期维护，BUG较少。

2025-02-08 16:32:21 143

原创 YOLO-day2-yolo5

day2-yolo5。

2025-02-08 16:31:39 113

原创 YOLO-day1-YOLO1-4

更快更简单：45fps，远高于Faster R-CNN，满足视频目标检测避免产生背景错误：整张图进行输入，充分利用上下文，不易出现错误背景信息IOU损失定义如下：交集越大，损失越小，解决了大目标对小目标的影响$$$$

2025-02-08 16:30:52 158

原创 CNN-day12-可变形卷积

Deformable Convolution可变形卷积，由微软亚洲研究院提出。

2025-02-08 16:26:55 909

原创 CNN-day11-注意力机制

神经网络能够在同样的计算资源下获得更强的表征能力和更优的性能表现。

2025-02-08 16:26:06 651

原创 CNN-day10-经典神经网络MobileNet V1＆V2＆V3

传统的卷积神经网络参数量大，导致预测时算力大，对于手机、嵌入式等移动设备来讲部署慢且占用空间，无法满足需求。2017年，Google提出的移动端高效率模型MobileNet：相比VGG16，分类准确率下降了0.9%，但是模型参数仅仅是VGG16的1/32到1/33。

2025-02-08 16:25:23 923

原创 CNN-day9-经典神经网络ResNet

深层网络有个梯度消失问题：模型变深时，其错误率反而会提升，该问题非过拟合引起，主要是因为梯度消失而导致参数难以学习和更新。

2025-02-08 16:24:47 465

原创 CNN-day8-经典神经网络GoogleNet

卷积核的尺寸等于1的特例，用来做升维和降维，减少参数量，改变通道数，通道间的特征融合。

2025-02-08 16:23:41 987

原创 CNN-day7-经典神经网络VGG

VGG的亮点在于它通过堆叠多个卷积层，以小的卷积核和池化层的方式来增加网络深度，从而实现高精度的图像识别。这种方法可以有效地捕获图像中的高级特征，并通过不断拟合训练数据来提高识别准确率。

2025-02-08 16:22:54 647

原创 CNN-day6-经典神经网络AlexNet

ImageNet大规模视觉挑战赛(ILSVRC)被称为深度学习在图像分类任务研究方面进展的标杆。AlexNet网络参加了ILSVRC2012年大赛获得冠军（超过第二名10%的性能），掀起了一波深度学习的浪潮，。

2025-02-08 16:22:05 686

原创 CNN-day5-经典神经网络LeNets5

super(LeNet5s, self).__init__() # 继承父类# 第一个卷积层nn.Conv2d(in_channels=1, # 输入通道out_channels=6, # 输出通道kernel_size=5, # 卷积核大小),nn.ReLU(),# 池化：平均池化# C3:3通道特征融合单元# C3:4通道特征融合单元# C3:4通道特征融合单元，剔除中间的1通道# C3:6通道特征融合单元# S4:池化# 全连接层。

2025-02-08 16:20:41 1032

原创 11111

GitHub - SaoYan/LearnToPayAttention: PyTorch implementation of ICLR 2018 paper Learn To Pay Attention (and some modification)

2024-12-13 19:56:26 109

原创 CNN-day4-迁移学习与模型优化

import os#导入需要的模型，如果是自己训练的模型要在同目录下#生成验证数据#关闭科学计数法打印#路径兼容处理#验证过程记录表格路径#1.验证数据transform=transforms.Compose([transforms.ToTensor(),transforms.Resize(32)#输入是32]))#2.模型：训练好的模型#初始化到模型#移到GPU上#3.使用训练好的模型对验证数据进行推理，看效果accuracy=0#总的数据保存#使用模型对数据进行推理。

2024-12-05 20:25:47 893

原创 CNN-day3-模型训练与优化

三大要素：数据、算法（神经网络）、算力。

2024-12-04 20:26:21 1370

原创 CNN-day2-池化

池化层 (Pooling) ：主要对卷积层学习到的特征图进行下采样（SubSampling）处理，可以降低空间维度, 缩减模型大小，提高计算速度。分类：1.最大池化max pooling：从每个局部区域中选择最大值作为池化后的值，可以保留局部区域中最显著的特征，在提取图像中的纹理、形状等方面具有很好的效果。2.平均池化 avgpooling：从每个局部区域中取平均值作为池化后的值，可以得到整体特征的平均值，在提取图像中的整体特征、减少噪声等方面具有较好的效果。

2024-12-03 19:54:54 1288

原创 CNN-day1 卷积

全连接网络在输入图像很大的时候计算成本高，图像也很难保留原有的特征，导致图像处理的准确率不高。卷积神经网络（Convolutional Neural Network,CNN）是专门处理具有网格状结构数据的深度学习模型。它是含有卷积层的神经网络，用来自动学习、提取图像的特征。构成：卷积层：提取图像中的局部特征池化层：大幅度降低运算量并进行特征增强全连接层：输出想要的结果。

2024-12-02 19:37:36 875

原创深度学习day8-批量标准化+项目

Batch Normalization （批量归一化）是经常使用一个网络层，其主要的作用是控制数据的分布，加快网络的收敛原因：神经网络的学习其实在学习数据的分布，随着网络的深度增加、网络复杂度增加，一般流经网络的数据都是一个 mini batch，每个 mini batch 之间的数据分布变化非常剧烈，这就使得网络参数频繁的进行大的调整以适应流经网络的不同分布的数据，给模型训练带来非常大的不稳定性，使得模型难以收敛。

2024-12-02 19:36:03 1212

原创深度学习day7-BP之梯度下降，过拟合与欠拟合

动量项更新：利用当前梯度和历史动量来计算新的动量项。权重参数更新：利用更新后的动量项来调整权重参数。梯度计算：在每个时间步计算当前的梯度，用于更新动量项和权重参数。没有对学习率进行优化。

2024-11-28 19:42:50 940

原创深度学习day6- 损失函数和BP算法1

输出层-softmax多分类，使用交叉熵损失函数输出层-sigmid二分类，使用二分类交叉熵损失函数线性回归-smoothL1损失函数/均方差损失L2Loss。

2024-11-27 19:35:30 846

原创深度学习day5-初始化与激活函数

人工智能：为机器赋予人的智能机器学习：一种实现人工智能的方法深度学习：一种实现机器学习的技术传统机器学习算法依赖于人工设计特征、提取特征，而深度学习模仿人脑的运行方式，从大量数据中学习特征，依赖算法自动提取特征，可解释性差。常用于：图像处理，自然语言处理，语音识别，自动驾驶，LLM，机器人。

2024-11-26 20:24:45 828

原创深度学习day4-模型

loss=nn.MSELoss()#均方误差工具e=loss(y_true,y_pred)#计算损失print(e)

2024-11-25 19:27:27 488

原创深度学习day3-自动微分

torch.autograd模块：自动微分模块，自动计算张量操作的梯度，可以自动求导实现权重参数的更新。

2024-11-22 19:08:49 584

原创深度学习day2-Tensor 2

Tensor：多维数组，用于存储和操作数据。

2024-11-21 17:04:00 781

原创深度学习day1-Tensor 1

PyTorch会将数据封装成张量（Tensor）进行计算，所谓张量就是元素为相同类型的多维矩阵。张量可以在 GPU 上加速运行。

2024-11-20 19:37:19 848

原创机器学习day7-线性回归3、逻辑回归、聚类、SVC

J(w) = \frac{1}{2m} \sum_{i=1}^{m} (h_w(x^{(i)}) - y^{(i)})^2+\lambda\sum_{j=1}^{n} w_j^2,w_j指所有的权重系数, λ指惩罚型系数，又叫正则项力度。n 是样本数量， p 是特征的数量， y_i 是第 i个样本的目标值， x_i 是第 i个样本的特征向量， w是模型的参数向量。模型在训练数据上表现得非常好，在新的数据上表现较差，常发生在模型过于复杂，学习了数据的真实模式、噪声和异常值。小于阈值认为是负例，输出0。

2024-11-19 20:12:17 1190

原创机器学习day6-线性代数2-梯度下降

③.g0，表示切线斜率为正，表示在导数为0的w值的右边，将w往左调小不断逼近导数为0的w值。对w_1求导，就是把w_2看成一个常数: loss(w1)’=2(w_1-3.5)+0+3w_2-4.5=2w_1+3w_2-11.5。对w_2求导，就是把w_1看成一个常数: loss(w2)’=0+2(w_2-2)+3w_1+2=2w_2+3w_1-2。中损失函数对于参数w的梯度就是此时w的切线斜率。

2024-11-18 17:19:48 1121

原创机器学习day5-随机森林和线性代数1最小二乘法

在坐标轴上画出对应的点（离散或者连续），如果是离散的点，需要找一条直线使得这些点尽可能多地在这条直线上，或者能够尽可能均匀地分布在这条直线的两边，达到损失值最小的目标，使其尽可能地接近能够进行准确预测的目标函数（最优直线）人工智能中的线性回归：数据集中很难找到一个完美的方程式完全满足所有的目标值，通过给出的数据集去拟合一条直线尽可能满足所要求的模型关系，从而得到对应的尽可能准确的目标值。用这n个样本来训练一个决策树。回归的目的是预测数值型的目标值y，求回归系数的过程就是回归，根据回归系数可以得到预测值。

2024-11-15 19:36:45 921 1

空空如也

空空如也