janedeer-优快云博客

原创 DAY50 预训练模型+CBAM模块

是残差网络中最重要的思想。网络堆叠层数过多后，模型准确率会下降，即“网络退化”。BasicBlock 不让网络层直接学习一个目标映射H(x)，而是学习映射与输入之间的差值，即残差。它能够简化学习目标，通过快捷连接/条约链接，避免了信息丢失或梯度消失的问题。

2025-08-21 13:37:59 817

能够集成到任何卷积神经网络架构中的注意力模块核心目标：通过学习的方式，自动获取特征图在通道和空间维度上的重要性，进而对特征图进行自适应调整，增强重要特征，抑制不重要特征，提升模型的特征表达能力和性能主要部分组成：通道注意力模块（Channel Attention Module）和空间注意力模块（Spatial Attention Module），这两个模块顺序连接与SE的不同之处：输入特征图 → 通道注意力模块 → 空间注意力模块 → 输出增强后的特征图。

2025-08-20 14:04:29 347

原创 DAY48 随机函数与广播机制

作业：自己多借助ai举几个例子帮助自己理解即可。

2025-08-19 20:17:35 751

原创 DAY47 注意力热图可视化

作业：对比不同卷积层热图可视化的结果。

2025-08-18 11:29:16 354

原创 DAY46 通道注意力(SE注意力)

注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器，就像人类视觉会自动忽略背景，聚焦于图片中的主体（如猫、汽车）。transformer中的叫做自注意力机制，他是一种自己学习自己的机制，他可以自动学习到图片中的主体，并忽略背景。我们现在说的很多模块，比如通道注意力、空间注意力、通道注意力等等，都是基于自注意力机制的。通道注意力（Channel Attention）属于注意力机制（Attention Mechanism）的变体，而非自注意力（Self-Attention）的直接变体。

2025-08-17 12:15:05 677

原创 DAY45 Tensorboard使用介绍

作业：对resnet18在cifar10上采用微调策略下，用tensorboard监控训练过程。

2025-08-16 16:18:55 278

原创 DAY44 预训练模型

模型年份提出团队关键创新点层数参数量ImageNet Top-5错误率典型应用场景预训练权重可用性LeNet-51998Yann LeCun等首个CNN架构，卷积层+池化层+全连接层，Sigmoid激活函数7~60KN/A手写数字识别（MNIST）无（历史模型）AlexNet2012Alex Krizhevsky等ReLU激活函数、Dropout、数据增强、GPU训练860M15.3%大规模图像分类PyTorch/TensorFlow官方支持VGGNet。

2025-08-15 10:28:38 828

原创 DAY43 复习日

作业：kaggle找到一个图像数据集，用cnn网络进行训练并且用grad-cam做可视化。进阶：并拆分成多个文件。

2025-08-14 16:04:30 149

原创 DAY42 Grad-CAM与Hook函数

作业：理解下今天的代码即可。

2025-08-13 11:04:51 736

原创 DAY41 简单CNN

作业：尝试手动修改下不同的调度器和CNN的结构，观察训练的差异。

2025-08-12 13:16:42 1753

原创 DAY40 训练和测试的规范写法

作业：仔细学习下测试和训练代码的逻辑，这是基础，这个代码框架后续会一直沿用，后续的重点慢慢就是转向模型定义阶段了。

2025-08-11 12:40:37 219

原创 DAY39 图像数据与显存

minist这个经典的手写数据集，作为图像数据，相较于结构化数据（表格数据）他的特点在于他每个样本的的形状并不是(特征数，)，而是(宽，高，通道数)维度索引含义数值说明0通道数（Channels）1表示这是一张灰度图（仅有一个颜色通道，如黑白照片）。如果是彩色图（如RGB），通道数为3。1高度（Height）28表示图像的垂直像素数为28像素。2宽度（Width）28表示图像的水平像素数为28像素。

2025-08-10 19:30:25 645

原创 DAY38 Dataset和Dataloader类

作业：了解下cifar数据集，尝试获取其中一张图片。

2025-08-09 12:28:41 457

原创 DAY37 早停策略和模型权重的保存

作业：对信贷数据集训练后保存权重，加载权重后继续训练50轮，并采取早停策略。

2025-08-08 11:57:59 297

原创 DAY36 复习日

【代码】DAY36 复习日。

2025-08-07 11:08:30 263

原创 DAY35 模型可视化与推理

作业：调整模型定义时的超参数，对比下效果。

2025-08-06 11:23:42 821

原创 DAY34 GPU训练及类的call方法

要是它们不在同一设备上，就会引发运行时错误。并非所有 PyTorch 对象都有 .to(device) 方法，只有继承自 torch.nn.Module 的模型以及 torch.Tensor 对象才有此方法。在 Python 中，__ call__ 方法是一个特殊的魔术方法（双下划线方法），它允许类的实例像函数一样被调用。这种特性使得对象可以表现得像函数，同时保留对象的内部状态。在 PyTorch 里，.to(device) 方法的作用是把张量或者模型转移到指定的计算设备（像 CPU 或者 GPU）上。

2025-08-05 10:41:44 375

原创 DAY33 MLP神经网络的训练

包含一个输入层，一个隐藏层和一个输出层定义层数和向前传播顺序class MLP(nn.Module): # 多层感知器MLP模型，继承父类nn.Modulesuper(MLP, self).__init__() # 调用父类的初始化函数self.fc1 = nn.Linear(4, 10) # 输出层到隐藏层self.fc2 = nn.Linear(10, 3) # 隐藏层到输出层# 输出层不需要激活函数，因为后面会用到交叉熵函数，内部有softmax函数，会把输出转为概率。

2025-08-04 13:08:14 383

原创 DAY32 官方文档的阅读

作业：参考pdpbox官方文档中的其他类，绘制相应的图，任选即可。

2025-08-03 20:50:17 168

原创 DAY31 文件的规范拆分和写法

作业：尝试针对之前的心脏病项目ipynb，将他按照今天的示例项目整理成规范的形式，思考下哪些部分可以未来复用。

2025-08-02 08:39:57 846

原创 DAY30 模块和库的导入

作业：自己新建几个不同路径文件尝试下如何导入。

2025-08-01 09:49:05 373

原创 DAY29 复习日：类的装饰器

作业：复习类和函数的知识点，写下自己过去29天的学习心得，如对函数和类的理解，对python这门工具的理解等，未来再过几个专题部分我们即将开启深度学习部分。

2025-07-31 10:35:27 430

原创 DAY28 类的定义和方法

包含属性：半径 radius。包含方法：calculate_area()：计算圆的面积（公式：πr²）。calculate_circumference()：计算圆的周长（公式：2πr）。初始化时需传入半径，默认值为 1。### 题目1：定义园类"""初始化圆，半径默认为1""""""计算圆的面积""""""计算圆的周长"""# 示例运行。

2025-07-30 10:59:57 353

原创 DAY27 函数专题2：装饰器

作业：编写一个装饰器 logger，在函数执行前后打印日志信息（如函数名、参数、返回值）

2025-07-29 10:27:43 194

原创 DAY26 函数专题1：函数定义与参数

【代码】DAY26 函数专题1：函数定义与参数。

2025-07-28 10:45:22 615

原创 DAY25 异常处理

作业：理解今日的内容即可，可以检查自己过去借助ai写的代码是否带有try-except机制，以后可以尝试采用这类写法增加代码健壮性。

2025-07-27 12:05:56 863

原创 DAY24 元组和OS模块

作业：对自己电脑的不同文件夹利用今天学到的知识操作下，理解下os路径。

2025-07-26 14:48:36 321

原创 DAY23 pipeline管道

作业：整理下全部逻辑的先后顺序，看看能不能制作出适合所有机器学习的通用pipeline。

2025-07-25 13:23:17 325

原创 DAY22 复习日

代码太长可以考虑将预处理操作放在自定义函数中，分别对训练集和测试集使用，可以减少代码长度。作业：自行学习参考如何使用kaggle平台，写下使用注意点，并对下述比赛提交代码。

2025-07-24 16:06:52 425

原创 DAY21 常见的降维算法

作业：探索下什么时候用到降维？降维的主要应用？或者让ai给你出题，群里的同学互相学习下。可以考虑对比下在某些特定数据集上t-sne的可视化和pca可视化的区别。

2025-07-23 12:55:57 673

原创 DAY20 奇异值SVD分解

作业：尝试利用svd来处理心脏病预测，看下精度变化。

2025-07-22 11:01:18 957

原创 DAY19 常见的特征筛选算法

作业：对心脏病数据集完成特征筛选，对比精度。

2025-07-21 15:36:04 423

原创 DAY18 推断聚类后簇的类型

聚类后的分析：推断簇的类型作业：参考示例代码对心脏病数据集采取类似操作，并且评估特征工程后模型效果有无提升。

2025-07-20 14:49:51 804

原创 DAY17 常见聚类算法

基于距离的聚类算法。

2025-07-19 17:26:57 881

原创 DAY16 数组的常见操作和形状

索引顺序：在二维数组 arr2d 里，第一个索引值代表行，第二个索引值代表列。比如 arr2d[i, j] ，i 是行索引，j 是列索引。SHAP值中，shap_values是一个numpy数组，对应（样本数，特征数，类别数）。取出第一行，对应的是（特征数，类别数目），表示这个样本对应的特征对目标类别的shap值贡献。这二者组合后，就可以组合（特征数，特征值，shap值）构成shap图的基本元素。矩阵点乘：满足两个矩阵的行数和列数相同，矩阵的加减：矩阵a和b行列相同，矩阵乘法：a的列数等于b的行数，

2025-07-18 17:02:12 502

空空如也

空空如也